SlideShare ist ein Scribd-Unternehmen logo
1 von 16
Downloaden Sie, um offline zu lesen
[研究論文発表会]
ボイスチェンジャーサービスの研究開発を通した
インターンによる次世代人材育成
白井暁彦*, 中野友介, 堀部貴紀
*GREE VR Studio Laboratory Director,
デジタルハリウッド大学院 客員教授
はじめに: インターンシップの重要性と実施形態
リクルートワークス研究所が米国の人材採用コンサルティング会社、CareerXroads 社の協力を得て実施した調査『2015
Internships USA』では、回答企業のうち、39.0%がインターンシップを単独で実施、51.2%がインターンシップと Co-op
プログラム双方を実施していると回答しており、両者を合わせると、調査対象企業の 90%超がインターンシップを実施し
ていることになる。これは、リクルートキャリア就職みらい研究所が発表した『就職白書 2015 ~インターンシップ編
~』の、2015 年にインターンシップを予定している日本国内の企業の割合(58.3%)を大きく上回る。
[1 ] リクルートワークス研究所 : "海外におけるインターンシップ最新事情"
https://www.works-i.com/research/others/item/160322_Internship_jp.pdf (Accessed 2021-07-31).
はじめに: コロナ禍のインターンシップを通した実践研究
【日本企業のインターン実施における課題】現状、日本で行われる多くのインターンシップは数日〜2週
間程度の短期プログラムであり、企業の活動紹介とハッカソンなどのグループワークにとどまるケースは
少なくない。2019年以降のコロナ禍において、物理的に参集する場を作ることは難しくなった。
【学生視点での課題】(学生側の視点では)志望する企業による採用審査という向きもあり、純粋な成長
の場とは考えづらい。より高度なプロフェッショナルの育成という視点でも、大学院を含めた高等教育で
の研究教育活動や、その研究成果の社会実装と関連がある企業活動に学生がどう関われるかが不明。
【研究的側面】筆者(白井)自身はフランスの高等教育機関にて ポスドクを経験しており、学生イン
ターンシップを通した産学連携の実践とイノベーションサイクルを目の当たりにしてきた。一方で制度的
に整備された環境においては、その個別の取組における工夫や、学生視点の気づきが方法論化しづらい。
日本におけるデジタルコンテンツ分野の次世代技術開発を行う人材育成 に貢献すべく、産学連携、そし
て学生の視点で方法論を具体的な研究開発の事例を通してまとめていきたい。
【今回の論文の価値】(多くは個々の企業におけるノウハウであり、オープンな形では共有されない)
学術的な貢献や高等教育がなすべきエコシステム、ひいては関わる学生の主体的な成長について注目した
設計や方法論について学術文献として明文化した。 知財創出や外部発表で、社員同様の扱いをする点。
技術分野: メタバース研究と音声信号処理
(弊ラボ) GREE VR Studio Laboratory: グリー
グループ でメタバース事業を推進するREALITY
株式会社にある研究開発部門であり、VRSNS・
メタバースのXR化によるUX開発、サービス開
発、関連する知財創出などを扱っている。
本論文では技術分野として特に、音声信号処理
ボイスチェンジャーサービス「転声こえうらな
い」をはじめとするサーバ技術、機械学習、モ
バイルやサーバプラットフォームにおけるリア
ルタイム処理やメタバース化における応用を
扱っている。
Twitter @koeuranai
https://vr.gree.net/lab/vc/
堀部貴紀『転声こえうらない』利用者の基本周波数分析
【いつでもどこでも「なりたい自分」になれるvocoder】

• 収録者のなりたい声のタイプを選ぶ(キャラクターの雰囲気で選びたい)

• 気軽に利用できる

• スマホで収録する



【満足できる品質には至らない例】

・収録者の声質の推定

・収録時に混入する背景雑音

・変換後のキャラクターとの印象

背景:スマホ時代の

アバター配信者のためのボイスチェンジャー

なりたいスタイル
外の騒音
エアコン
部屋の環境や持ち方
堀部貴紀『転声こえうらない』利用者の基本周波数分析
● ブラウザのみで利用できる

無料ボイスチェンジャーサービス


● Twitterでシェアして拡散させる

● なりたい声は13種類

● WebAudio経由で保存した10秒間の音声をボ
コーダーに渡してサーバ上で変換する


● 声のタイプに対応したプリセット(声の高さ
:pitch, フォルマント:formant)

● 利用者は同意に基づき実験に参加


音声サンプルとともに

声のタイプと性別(男性, 中性, 女性)を


自己申告で回答

「転声こえうらない」
 https://vr.gree.net/lab/vc/
堀部貴紀『転声こえうらない』利用者の基本周波数分析
分析対象

対象区間 2019年7月1日から2020年3月31日
最大収録時間 10秒
合計収録件数 40,467件
重複を省いた件数 20,803件
【分析対象とサンプル件数】

● 分析項目

○ 統計的に容易な基本周波数

○ 利用者の収録環境を把握するため信号対雑音比(SNR)

(類似の研究に対して)非常に多くのサンプルを獲得することができた
収録時間、平均基本周波
数、SNRが小数点3桁まで一
致するサンプルを同一発話
とみなして除外

堀部貴紀『転声こえうらない』利用者の基本周波数分析
分析結果

● 最大10秒までにしているが, 10秒以上話している話者が多い

● 本サービス開始からの約 8 ヶ月間において, 男性利用者が多い

● 0 dBあたりのサンプルは収録に失敗していることを示す

● 50 dB付近にピークが観測される以外にも, 150 dB付近に,

もう1つのピークが観測できる(興味深い)

堀部貴紀『転声こえうらない』利用者の基本周波数分析
分析結果 – 期間を区切った分析 -

平均基本周波数
信号対雑音比
女性比率が上がっている
収録環境は概ね均一
堀部貴紀『転声こえうらない』利用者の基本周波数分析
実験結果 - 自己申告の性別を考慮した分析 -

• 音声と性別を紐づけるため, 2020年3月から収録音声に対して自己申告で性別を
男性,女性,中性の3種類の集計を始めた.
• 声のスタイルや自己申告の性別など詳細なデータを集計した 2020 年 3 月 1 日か
ら 3 月 31 日までの 1 ヶ月間について性別に基づいた平均基本周波数のヒストグ
ラム
● 男性を選択した利用者のF0

● 一般男性の平均125 Hz 近辺が 1 番多い


● 利用者の中にも, F0が200 Hz∼250 Hz近辺という結果になった利用者もいた


● 一般女性の声の高さのような特徴を持っていることがわかる
● 中性を選択した利用者:女性のように声が高い


● 本分析のサンプル数が少ないため, 今後も引き続き調査していく必要


堀部貴紀『転声こえうらない』利用者の基本周波数分析
•  

総括

[堀部さんの最近の研究]ARでメタバースを表現してみた
[中野さんの最近の研究]"音"からイキイキした表現を求めて
日々の働き方: オンラインでのインターン研究生活
・日々の作業スタイルは、朝9:30開始、夕方18:30までが定時
・朝会(Zoom)にてその日の行動方針や目標などを各インターンが 自律的に計画
・Google Slidesにて1日1枚の日報を書き、夕会にて成果を発表する。
・必要であれば個別に集中作業としてミーティングやペアプログラミング、
 もしくはモブプログラミング(一人のコーディングを複数人が見ながら学習する)を行うこともある。
・ラボ内で常に 他のメンバーのプロジェクトを見ながら日々進行する
 外部向けのコンテンツやPoCプロジェクト、学会発表などがある場合はQA作業やレビューに積極参加
大学の研究室と異なる点
・時給制のアルバイト社員であり、時間に対するパフォーマンスは常に評価される点である。
・終了時間は特に許可がない限りは残業しない方針。
学生視点での特色
・グリーグループはアルバイトであっても社員と同じ扱いをする。
・社員の全社ミーティングや総会といった比較的機密レベルが高い会議にも出席し、メタバース開発の現
場のサービス開発の現場を学ぶ機会がある。
・社外向けのBlog執筆や特許出願も推奨されており、発明報奨金などの制度も社員と同様。
・なおコロナウイルスに対するワクチン 接種も職域接種で実施した。
まとめ:今後に向けて
短期インターンおよび採用プロセスでは、
「出来上がった優秀な学生を選ぶ」という視点になりがち。
近年の大学の環境を顧みると「人を育てる」という視点で、回り道をしながらも、
できるだけ柔軟に幅広い技術や表現力を、自分の中に「垂直に」醸成できる人物を
育成していくことが近道にも思える。
もちろんそのためには相当の時間も必要であるが、研究開発を自発的に推進するた
めの 基礎力を学生の視点で実務を通して獲得 させながら、
学術活動としての論文執筆や外部発表、社内での展開、知財取得や時間管理など、
企業活動を通した社会実装スキルを高めていく両輪の視点の方法論化は重要であり
今後も長期インターンシップ事例の共有機会があればまとめていきたい。
★本論文を執筆するにあたり、GREE VR Studio Laboratoryのインターン各位、REALITY株式会社・荒木英士氏、および明治大学・森勢将雅先生に感謝を記します。

Weitere ähnliche Inhalte

Ähnlich wie ボイスチェンジャーサービスの研究開発を通したインターンによる次世代人材育成

Ähnlich wie ボイスチェンジャーサービスの研究開発を通したインターンによる次世代人材育成 (6)

Sro
SroSro
Sro
 
ソーシャルメディア活用のワークショップ ver1.5
ソーシャルメディア活用のワークショップ ver1.5ソーシャルメディア活用のワークショップ ver1.5
ソーシャルメディア活用のワークショップ ver1.5
 
インターンの応募単価を1/10にした最新の採用手法とは
インターンの応募単価を1/10にした最新の採用手法とはインターンの応募単価を1/10にした最新の採用手法とは
インターンの応募単価を1/10にした最新の採用手法とは
 
Youth planet _Lキャリ
Youth planet _LキャリYouth planet _Lキャリ
Youth planet _Lキャリ
 
優秀な人材を獲得するために経営者が身に付けるべき「採用学」 先生:服部 泰宏
優秀な人材を獲得するために経営者が身に付けるべき「採用学」 先生:服部 泰宏優秀な人材を獲得するために経営者が身に付けるべき「採用学」 先生:服部 泰宏
優秀な人材を獲得するために経営者が身に付けるべき「採用学」 先生:服部 泰宏
 
強みに関するプレゼンテーション
強みに関するプレゼンテーション強みに関するプレゼンテーション
強みに関するプレゼンテーション
 

Mehr von GREE VR Studio Lab

オープンソースで構築するWebメタバース ~Mozilla Hubsで学ぶUX開発から運用コスト最小化まで #CEDEC2022
オープンソースで構築するWebメタバース ~Mozilla Hubsで学ぶUX開発から運用コスト最小化まで #CEDEC2022オープンソースで構築するWebメタバース ~Mozilla Hubsで学ぶUX開発から運用コスト最小化まで #CEDEC2022
オープンソースで構築するWebメタバース ~Mozilla Hubsで学ぶUX開発から運用コスト最小化まで #CEDEC2022
GREE VR Studio Lab
 
パネルディスカッション:WebXRメタバースの挑戦 in CEDEC2022 ~Mozilla Hubs活用事例と課題共有~
パネルディスカッション:WebXRメタバースの挑戦 in CEDEC2022 ~Mozilla Hubs活用事例と課題共有~パネルディスカッション:WebXRメタバースの挑戦 in CEDEC2022 ~Mozilla Hubs活用事例と課題共有~
パネルディスカッション:WebXRメタバースの挑戦 in CEDEC2022 ~Mozilla Hubs活用事例と課題共有~
GREE VR Studio Lab
 
#XRKaigi 「Mozilla Hubsを用いたバーチャルイベントのWebVR化~その可能性と実際~」[20201208] #VRStudioLab
#XRKaigi 「Mozilla Hubsを用いたバーチャルイベントのWebVR化~その可能性と実際~」[20201208] #VRStudioLab#XRKaigi 「Mozilla Hubsを用いたバーチャルイベントのWebVR化~その可能性と実際~」[20201208] #VRStudioLab
#XRKaigi 「Mozilla Hubsを用いたバーチャルイベントのWebVR化~その可能性と実際~」[20201208] #VRStudioLab
GREE VR Studio Lab
 

Mehr von GREE VR Studio Lab (20)

AI神絵師はITエンジニアの未来をどう変えるのか
AI神絵師はITエンジニアの未来をどう変えるのかAI神絵師はITエンジニアの未来をどう変えるのか
AI神絵師はITエンジニアの未来をどう変えるのか
 
Evaluation of time-shifted emotion through shared emoji reactions in a video ...
Evaluation of time-shifted emotion through shared emoji reactions in a video ...Evaluation of time-shifted emotion through shared emoji reactions in a video ...
Evaluation of time-shifted emotion through shared emoji reactions in a video ...
 
オープンソースで構築するWebメタバース ~Mozilla Hubsで学ぶUX開発から運用コスト最小化まで #CEDEC2022
オープンソースで構築するWebメタバース ~Mozilla Hubsで学ぶUX開発から運用コスト最小化まで #CEDEC2022オープンソースで構築するWebメタバース ~Mozilla Hubsで学ぶUX開発から運用コスト最小化まで #CEDEC2022
オープンソースで構築するWebメタバース ~Mozilla Hubsで学ぶUX開発から運用コスト最小化まで #CEDEC2022
 
パネルディスカッション:WebXRメタバースの挑戦 in CEDEC2022 ~Mozilla Hubs活用事例と課題共有~
パネルディスカッション:WebXRメタバースの挑戦 in CEDEC2022 ~Mozilla Hubs活用事例と課題共有~パネルディスカッション:WebXRメタバースの挑戦 in CEDEC2022 ~Mozilla Hubs活用事例と課題共有~
パネルディスカッション:WebXRメタバースの挑戦 in CEDEC2022 ~Mozilla Hubs活用事例と課題共有~
 
GREE Tech Conf 2022 GREE VR Studio Laboratory - UXDev R&D Summary 2022 #GREETC
GREE Tech Conf 2022 GREE VR Studio Laboratory  - UXDev R&D Summary 2022 #GREETCGREE Tech Conf 2022 GREE VR Studio Laboratory  - UXDev R&D Summary 2022 #GREETC
GREE Tech Conf 2022 GREE VR Studio Laboratory - UXDev R&D Summary 2022 #GREETC
 
20220113「LightShip Global Jam 参加体験記 ~ARDKを使った人材育成」
20220113「LightShip Global Jam 参加体験記 ~ARDKを使った人材育成」20220113「LightShip Global Jam 参加体験記 ~ARDKを使った人材育成」
20220113「LightShip Global Jam 参加体験記 ~ARDKを使った人材育成」
 
REALITY: We can be whoever we want - Avatar driven metaverse service and UX R...
REALITY: We can be whoever we want - Avatar driven metaverse service and UX R...REALITY: We can be whoever we want - Avatar driven metaverse service and UX R...
REALITY: We can be whoever we want - Avatar driven metaverse service and UX R...
 
VTuber・XRライブエンタメ駆動の研究開発 - GREE VR Studio Laboratory のR2D #GREETC
VTuber・XRライブエンタメ駆動の研究開発 - GREE VR Studio Laboratory のR2D #GREETCVTuber・XRライブエンタメ駆動の研究開発 - GREE VR Studio Laboratory のR2D #GREETC
VTuber・XRライブエンタメ駆動の研究開発 - GREE VR Studio Laboratory のR2D #GREETC
 
GREE VR Studio Laboratory 「XR-UX Devプロジェクト」の成果紹介 #GREETC (2021/Nov/11)
GREE VR Studio Laboratory 「XR-UX Devプロジェクト」の成果紹介 #GREETC (2021/Nov/11)GREE VR Studio Laboratory 「XR-UX Devプロジェクト」の成果紹介 #GREETC (2021/Nov/11)
GREE VR Studio Laboratory 「XR-UX Devプロジェクト」の成果紹介 #GREETC (2021/Nov/11)
 
VR Entertainment goes to XR metaverse
VR Entertainment goes to XR metaverseVR Entertainment goes to XR metaverse
VR Entertainment goes to XR metaverse
 
20211004 XRメタバース時代における触覚の役割について
20211004 XRメタバース時代における触覚の役割について20211004 XRメタバース時代における触覚の役割について
20211004 XRメタバース時代における触覚の役割について
 
第26回VR学会大会 企業セッション-メタバース panel talk
第26回VR学会大会 企業セッション-メタバース panel talk第26回VR学会大会 企業セッション-メタバース panel talk
第26回VR学会大会 企業セッション-メタバース panel talk
 
「転声こえうらない」を通したボイスチェンジャー品質改善のための定性分析と考察
「転声こえうらない」を通したボイスチェンジャー品質改善のための定性分析と考察「転声こえうらない」を通したボイスチェンジャー品質改善のための定性分析と考察
「転声こえうらない」を通したボイスチェンジャー品質改善のための定性分析と考察
 
VibeShare: Vote -オンラインでの出演者と観客の非言語コミュニケーションの実現-
VibeShare: Vote -オンラインでの出演者と観客の非言語コミュニケーションの実現-VibeShare: Vote -オンラインでの出演者と観客の非言語コミュニケーションの実現-
VibeShare: Vote -オンラインでの出演者と観客の非言語コミュニケーションの実現-
 
#XRKaigi 「Mozilla Hubsを用いたバーチャルイベントのWebVR化~その可能性と実際~」[20201208] #VRStudioLab
#XRKaigi 「Mozilla Hubsを用いたバーチャルイベントのWebVR化~その可能性と実際~」[20201208] #VRStudioLab#XRKaigi 「Mozilla Hubsを用いたバーチャルイベントのWebVR化~その可能性と実際~」[20201208] #VRStudioLab
#XRKaigi 「Mozilla Hubsを用いたバーチャルイベントのWebVR化~その可能性と実際~」[20201208] #VRStudioLab
 
VIRTUAL BEINGS WORLD “NEW PLAY TOGETHER” - SIGGRAPH 2020 BoF
VIRTUAL BEINGS WORLD “NEW PLAY TOGETHER” - SIGGRAPH 2020 BoFVIRTUAL BEINGS WORLD “NEW PLAY TOGETHER” - SIGGRAPH 2020 BoF
VIRTUAL BEINGS WORLD “NEW PLAY TOGETHER” - SIGGRAPH 2020 BoF
 
VRSJ2020「交流型WebVRにおける空間音響のオンライン評価手法」
VRSJ2020「交流型WebVRにおける空間音響のオンライン評価手法」VRSJ2020「交流型WebVRにおける空間音響のオンライン評価手法」
VRSJ2020「交流型WebVRにおける空間音響のオンライン評価手法」
 
VRSionUp!7-Spokeを使ったイベント設営TIPS
VRSionUp!7-Spokeを使ったイベント設営TIPSVRSionUp!7-Spokeを使ったイベント設営TIPS
VRSionUp!7-Spokeを使ったイベント設営TIPS
 
VRSionUp7 Hubsイベント運営に便利なロール機能
VRSionUp7 Hubsイベント運営に便利なロール機能VRSionUp7 Hubsイベント運営に便利なロール機能
VRSionUp7 Hubsイベント運営に便利なロール機能
 
#VRSionUp!7 "Hubs Study"
#VRSionUp!7 "Hubs Study"#VRSionUp!7 "Hubs Study"
#VRSionUp!7 "Hubs Study"
 

ボイスチェンジャーサービスの研究開発を通したインターンによる次世代人材育成