SlideShare ist ein Scribd-Unternehmen logo
1 von 30
Downloaden Sie, um offline zu lesen
ごちゃまぜ歌ボTIPS!
歌うボイスロイドで様々な
ツールを有効活用しよう!
歌うボイスロイドワークショップ2
開催日:2018年9月24日
はなすひと:スズモフ (@suzu_dov)
加筆・公開:2018年10月21日
リズム調声は結構大変
 ボイスロイド上で一からリズムを整えていく
には音声を聴いて話速や長音の数を変えてい
く必要があります。
 もしVocalShifterやMelodyneなどのツールを
使うとして一つ一つのタイミングを直さない
といけないので結構大変。
KotonoSyncの紹介
 ボーカロイドで作成したシーケンスデータ
ファイルを使って音階に合わせたボイスロイ
ド用のフレーズ辞書を作ることが出来ます。
 更に音声保存と分析・調整を自動的に繰り返
すことで手間のかかるリズム調整を全自動で
行うことができます。
KotonoSyncとピヨ式の違い
 コトノシンクはビビピヨさんのピヨ式調声法
の考え方を元に作っています。
 全自動ではあるけどピヨ式でもある?
 手動でピヨ式調声するのとKotonoSyncで自
動調整するのにはそれぞれ利点があります。
KotonoSyncの特徴
 ボーカロイドあるいは他の歌声合成ソフトの
使い方を知っている必要がある。
 リズム調整にはそれなりに時間がかかる
(曲の長さやマシンスペックで変わります)
 タイミング合わせを最優先で行うので調整の
幅が若干狭まる(一応KotonoSyncにも様々
な変換設定を活用することで歌わせ方に幅を
持たせる事ができます)
ピヨ式調声法の特徴
 音階やリズムの調整が大変。
 一からフレーズを組み立てていくので自動調
整では見逃しがちなかわいさポイントを発見
できる可能性がある。
 コトノシンクでも結局細かい調整しようとす
るとそのあとにピヨ式調整法でフレーズを直
していく必要がある。
ピヨ式調声とKotonoSyncは
両立しない?
 どちらにもそれぞれの良さがあるので自分に
合った方を使いましょう。
 KotonoSyncはリズムの自動調整後に出来上
がったフレーズを更に調声する事も可能です。
 一つのフレーズの調声を物凄くこだわってい
くと一からピヨ式調声していく場合と時間的
に変わらない場合もある?
KotonoSyncの使い方
 改めてここからはコトノシンクの使い方を紹
介していきます。
 ただ、全ての設定を紹介するといくら時間が
あっても足りないので、特に重要な設定やよ
くある疑問に答えていく形にしていきます。
歌のデータを用意する1
 コトノシンクにはVOCALOID3または4で作っ
たVSQXファイルが必要になります。
 しかし2018年7月に発売されたVOCALOID5で
は保存時の形式がVSQXからVPRというファイ
ルに変わりました。
 じゃあ新しいボーカロイドからはコトノシン
クを使えない?
 Ver.2.0からVPR形式にも対応しました!
歌のデータを用意する2
 よくある質問「コトノシンクはボーカロイド
を持っていないと使えないの?」
 UTAUで作ったUSTファイルをVSQXに変換す
るConvMakiというUTAUプラグインおよび変
換アプリがあります!(作者:りばもさん)
 他の形式で作られたデータであっても探せば
変換ツールが公開されているかも・・・?
VOCALOID3/4 Editor
 元々コトノシンクで使うことを想定していた
アプリケーション。
 ボカロに歌わせるときの基本ソフトです。
 残念ながら新バージョン発表に関連して現在
生産分を持って販売が終了するようです。
 店舗などを探せばまだ売っているかも?
 こちらを持っているとほぼ差額でVOCALOID5
にアップグレードできる。
VOCALOID5
 最近発売された新しいボカロエディタ。
 様々なエフェクトをかけられるようになった
 シンガースキルやブレスなどの新機能沢山。
 でも残念ながらコトノシンクは読み込みだけ
でそれらの新機能に対応するような変換はで
きません。
Piapro Studio
 クリプトンから販売されているボーカロイド
製品などにバンドルされているボカロエディ
タ。これを使ってもVSQXが作成できます。
 この製品の独自形式のPPSFには対応していま
せん。
対応するボイスロイド
 今のところEXシリーズ以降のボイスロイド
に全て対応しています。
 前バージョンの琴葉姉妹は製品名にEXが
入ってませんが、EXシリーズと同等の機能
を有しているので歌わせる事ができます。
 もちろんボイスロイド2に対応しています。
 ・・・なぜかギャラ子Talkや音街ウナTalkEx
にも対応しています(コトノアシストも同様)
コトノシンクの設定を少し紹介
 していきます!
音声効果の話速に注意
 ボイスロイドのフレーズ編集で話速を0.5から
2.0の範囲で設定できますが、音声効果では最
大話速4.0まで選べるようになっています。
 テンポの速い曲では喋りが歌に追いつかない
場合があるので、事前に音声効果の話速を2.0
にする事で歌えるようになる場合も。
 例えば音声効果を2.0にするとフレーズ編集の
0.5から2.0の話速は1.0から4.0の数値に置き換
えられます。
話速目標値の設定
 ピヨ式調整法の場合も大事な部分ですが、単にリズム
を揃えるだけじゃなくてそれぞれの読みのモーラの話
速を高めや低めに出来るだけ合わせて調整する事がで
きます。
 先頭音の話速目標値を下げると子音の発音が丁寧に
なったりします。逆に上げるとハキハキした歌い方に
なります。
 長音の話速目標値は下げる方が比較的ロングトーンが
安定しやすいです。コトノシンクは元々長音の話速目
標値の初期値が0.5になっています。
 末尾の話速目標値は直前の高さの変化スピードが変わ
ります。高くするとケロケロボイスっぽく?
フレーズ分割の条件
 ボイスロイドはフレーズという単位で喋った
り歌ったりするので、音符という形で作られ
ている歌データもフレーズという形に置き換
えないといけません。
 コトノシンクは基本的に休符のある場所でフ
レーズを分割するようになっていますが、こ
れにはいくつかの例外があります。
ボカロの休符の仕様
 ボーカロイドは仕様で休符の長さが16分休
符未満になるとその前後で音を切らずに繋げ
る仕様があります。
 コトノシンクもそれに合わせて同じような長
さでは音を繋げるようになっています。
 不要な場合はこの設定をオフにしてください。
ボイロのポーズ長の制限
 ボイスロイドは任意ポーズの長さを80ミリ
秒未満に設定する事ができません。
 コトノシンクはフレーズ間の隙間まで正確に
調整しようとするので、もしこの休符が80
ミリ秒以下になってしまうと都合が悪いです。
 そこでコトノシンクでは休符が80ミリ秒未
満になりそうな場合はフレーズを分割せずに
代わりに促音を挟んで対応します。
そんな事言わずにフレーズを分
割したい!
 促音を使うとポーズを挟んだときと似たよう
な発音になる事もありますが、基本的に別物
です。
 ボイスロイド側の仕様に左右されずにフレー
ズ分割したいときはフレーズの強制分割機能
を使ってください。
琴葉姉妹で同じパートを歌う
 琴葉姉妹は感情無しで歌わせると聞き分けが
困難なくらいに同じ歌い方になります。
 そして同じパートを歌ってもらうと二人いる
事がわからなくなってしまうくらいです。
 コトノシンクのキー調整は小数点単位で設定
可能です。0.1とか0.2くらいずらせば別々に
聞こえる?
 リズム崩しで歌い方にゆらぎを持たせる事も。
他にも様々な設定があります
 息漏れ追加機能なんて言うのもあります。
 他にもボカロのVSQXファイルの解釈の仕方を
変えたり、読みにひらがなやカタカナを使い
分けることで無声化の指示を行うことも?
 PSDToolKitで使えるLAB形式のタイミング
ファイルを出力できます。口パクできるよ!
 全部の設定を知る必要はありません。必要に
なったらちょっとずつ設定を試していきま
しょう。
他のアプリの紹介
 Intervallo
ボイスロイドに歌わせた音声とVSQXファイル
やVPRファイルを使ってピッチ調整を自動的に
行えます。ボイロが本来歌えない高さも調整し
てくれてビブラートの効果を付ける事も。
 KotonoTone
ボイスロイドのロングトーンを整えてくれるア
プリです。動画を見れば大体わかるのでそちら
を見てね。
オマケ
 ボイスロイド2の感情の活用を考えてみる。
 ボイスロイド2の抑揚を0にすると喋り方の
変化がほぼ無くなってしまう。
 声質の変化は0.5以上で起こるけどその中間の
声を出す事ができない・・・
中間の声を出す方法を考える
 二つの音声を用意して重ねてみる
別々の二人が歌ってるように聞こえてしまう
 イコライザで上手く上げ下げしてみる
フォルマントの特徴とかを考えて上手くやれば
出来るかもしれないけど凄く大変・・・
 機械学習を試してみる?
そこまでせずにどうにかしたい
試作品を用意してみました
 こちらをご覧下さい。
KotonoFader コトノフェーダー
 二つの音声をいい感じに混ぜてみる実験的な
アプリです。
 今日の朝の7時前くらいに出来ました。
 そのせいでスライドの作成が大幅に遅れまし
た。本当にごめんなさい。
 大したテストしてないので実用性不明です。
どんなときに使える?
 複数の感情の中間の声がほしいとき
 複数の発音の中間の声がほしいとき
 歌だけじゃなくても喋りでも使えるかも?
 タイミングがほぼぴったり揃った二つの音声
が必要なので別キャラ同士だと上手くいかな
いかも?
 処理の性質上若干の音質の劣化が起きる?
・・・とりあえず何かに試してみてください!
今回の解説は以上です!
 非常に準備不足でごめんなさい!
 このままだとスライドが未完成すぎるので、
もう少し整えた上で後日公開します。
 コトノフェーダーはこのあと公開予定です。
 ここまでお付き合い頂きありがとうございま
した。

Weitere ähnliche Inhalte

Was ist angesagt?

信号の独立性に基づく多チャンネル音源分離
信号の独立性に基づく多チャンネル音源分離信号の独立性に基づく多チャンネル音源分離
信号の独立性に基づく多チャンネル音源分離NU_I_TODALAB
 
ゲーム音楽演出を進化させる「インタラクティブミュージック」と「音楽的ゲームデザイン」
ゲーム音楽演出を進化させる「インタラクティブミュージック」と「音楽的ゲームデザイン」ゲーム音楽演出を進化させる「インタラクティブミュージック」と「音楽的ゲームデザイン」
ゲーム音楽演出を進化させる「インタラクティブミュージック」と「音楽的ゲームデザイン」Sho Iwamoto
 
ポアソン画像合成
ポアソン画像合成ポアソン画像合成
ポアソン画像合成Arumaziro
 
建築革命、更に更に進化!便利さ向上【Unity Reflect ver 3.0 】
建築革命、更に更に進化!便利さ向上【Unity Reflect ver 3.0 】建築革命、更に更に進化!便利さ向上【Unity Reflect ver 3.0 】
建築革命、更に更に進化!便利さ向上【Unity Reflect ver 3.0 】Unity Technologies Japan K.K.
 
AbemaTVの動画配信を支えるサーバーサイドシステム
AbemaTVの動画配信を支えるサーバーサイドシステムAbemaTVの動画配信を支えるサーバーサイドシステム
AbemaTVの動画配信を支えるサーバーサイドシステムyuichiro nakazawa
 
setParamを用いた原音設定の解説
setParamを用いた原音設定の解説setParamを用いた原音設定の解説
setParamを用いた原音設定の解説Tatsumi
 
人工知能技術を用いた各医学画像処理の基礎 (2022/09/09)
人工知能技術を用いた各医学画像処理の基礎 (2022/09/09)人工知能技術を用いた各医学画像処理の基礎 (2022/09/09)
人工知能技術を用いた各医学画像処理の基礎 (2022/09/09)Yutaka KATAYAMA
 
音声の声質を変換する技術とその応用
音声の声質を変換する技術とその応用音声の声質を変換する技術とその応用
音声の声質を変換する技術とその応用NU_I_TODALAB
 
サウンドクリエイターがほんの少しBPに触れるだけで起こる革命
サウンドクリエイターがほんの少しBPに触れるだけで起こる革命サウンドクリエイターがほんの少しBPに触れるだけで起こる革命
サウンドクリエイターがほんの少しBPに触れるだけで起こる革命Satoru Okubo
 
音声信号の分析と加工 - 音声を自在に変換するには?
音声信号の分析と加工 - 音声を自在に変換するには?音声信号の分析と加工 - 音声を自在に変換するには?
音声信号の分析と加工 - 音声を自在に変換するには?NU_I_TODALAB
 
UE4プログラマー勉強会 in 大阪 -エンジンの内部挙動について
UE4プログラマー勉強会 in 大阪 -エンジンの内部挙動についてUE4プログラマー勉強会 in 大阪 -エンジンの内部挙動について
UE4プログラマー勉強会 in 大阪 -エンジンの内部挙動についてcom044
 
独立低ランク行列分析に基づく音源分離とその発展
独立低ランク行列分析に基づく音源分離とその発展独立低ランク行列分析に基づく音源分離とその発展
独立低ランク行列分析に基づく音源分離とその発展Kitamura Laboratory
 
楽曲中歌声加工における声質変換精度向上のための歌声・伴奏分離法
楽曲中歌声加工における声質変換精度向上のための歌声・伴奏分離法楽曲中歌声加工における声質変換精度向上のための歌声・伴奏分離法
楽曲中歌声加工における声質変換精度向上のための歌声・伴奏分離法NU_I_TODALAB
 
インターネットにおける動画配信の仕組み
インターネットにおける動画配信の仕組みインターネットにおける動画配信の仕組み
インターネットにおける動画配信の仕組みRyosuke Kubo
 
動画配信の基礎知識
動画配信の基礎知識動画配信の基礎知識
動画配信の基礎知識Daiyu Hatakeyama
 
OPTPiX SpriteStudioと他社ツール比較(真)資料1 - 株式会社ウェブテクノロジ - GTMF 2018 OSAKA / TOKYO
OPTPiX SpriteStudioと他社ツール比較(真)資料1 - 株式会社ウェブテクノロジ - GTMF 2018 OSAKA / TOKYOOPTPiX SpriteStudioと他社ツール比較(真)資料1 - 株式会社ウェブテクノロジ - GTMF 2018 OSAKA / TOKYO
OPTPiX SpriteStudioと他社ツール比較(真)資料1 - 株式会社ウェブテクノロジ - GTMF 2018 OSAKA / TOKYOGame Tools & Middleware Forum
 
音源分離 ~DNN音源分離の基礎から最新技術まで~ Tokyo bishbash #3
音源分離 ~DNN音源分離の基礎から最新技術まで~ Tokyo bishbash #3音源分離 ~DNN音源分離の基礎から最新技術まで~ Tokyo bishbash #3
音源分離 ~DNN音源分離の基礎から最新技術まで~ Tokyo bishbash #3Naoya Takahashi
 
注目の最新技術「WebRTC」とは? -技術概要と事例紹介-
注目の最新技術「WebRTC」とは? -技術概要と事例紹介-注目の最新技術「WebRTC」とは? -技術概要と事例紹介-
注目の最新技術「WebRTC」とは? -技術概要と事例紹介-Yusuke Naka
 

Was ist angesagt? (20)

信号の独立性に基づく多チャンネル音源分離
信号の独立性に基づく多チャンネル音源分離信号の独立性に基づく多チャンネル音源分離
信号の独立性に基づく多チャンネル音源分離
 
ゲーム音楽演出を進化させる「インタラクティブミュージック」と「音楽的ゲームデザイン」
ゲーム音楽演出を進化させる「インタラクティブミュージック」と「音楽的ゲームデザイン」ゲーム音楽演出を進化させる「インタラクティブミュージック」と「音楽的ゲームデザイン」
ゲーム音楽演出を進化させる「インタラクティブミュージック」と「音楽的ゲームデザイン」
 
ポアソン画像合成
ポアソン画像合成ポアソン画像合成
ポアソン画像合成
 
建築革命、更に更に進化!便利さ向上【Unity Reflect ver 3.0 】
建築革命、更に更に進化!便利さ向上【Unity Reflect ver 3.0 】建築革命、更に更に進化!便利さ向上【Unity Reflect ver 3.0 】
建築革命、更に更に進化!便利さ向上【Unity Reflect ver 3.0 】
 
AbemaTVの動画配信を支えるサーバーサイドシステム
AbemaTVの動画配信を支えるサーバーサイドシステムAbemaTVの動画配信を支えるサーバーサイドシステム
AbemaTVの動画配信を支えるサーバーサイドシステム
 
アンリアルエンジン4で ノンフォトリアル描画しよう!@UNREAL FEST 2015 YOKOHAMA
アンリアルエンジン4で ノンフォトリアル描画しよう!@UNREAL FEST 2015 YOKOHAMAアンリアルエンジン4で ノンフォトリアル描画しよう!@UNREAL FEST 2015 YOKOHAMA
アンリアルエンジン4で ノンフォトリアル描画しよう!@UNREAL FEST 2015 YOKOHAMA
 
setParamを用いた原音設定の解説
setParamを用いた原音設定の解説setParamを用いた原音設定の解説
setParamを用いた原音設定の解説
 
人工知能技術を用いた各医学画像処理の基礎 (2022/09/09)
人工知能技術を用いた各医学画像処理の基礎 (2022/09/09)人工知能技術を用いた各医学画像処理の基礎 (2022/09/09)
人工知能技術を用いた各医学画像処理の基礎 (2022/09/09)
 
音声の声質を変換する技術とその応用
音声の声質を変換する技術とその応用音声の声質を変換する技術とその応用
音声の声質を変換する技術とその応用
 
サウンドクリエイターがほんの少しBPに触れるだけで起こる革命
サウンドクリエイターがほんの少しBPに触れるだけで起こる革命サウンドクリエイターがほんの少しBPに触れるだけで起こる革命
サウンドクリエイターがほんの少しBPに触れるだけで起こる革命
 
音声信号の分析と加工 - 音声を自在に変換するには?
音声信号の分析と加工 - 音声を自在に変換するには?音声信号の分析と加工 - 音声を自在に変換するには?
音声信号の分析と加工 - 音声を自在に変換するには?
 
UE4プログラマー勉強会 in 大阪 -エンジンの内部挙動について
UE4プログラマー勉強会 in 大阪 -エンジンの内部挙動についてUE4プログラマー勉強会 in 大阪 -エンジンの内部挙動について
UE4プログラマー勉強会 in 大阪 -エンジンの内部挙動について
 
独立低ランク行列分析に基づく音源分離とその発展
独立低ランク行列分析に基づく音源分離とその発展独立低ランク行列分析に基づく音源分離とその発展
独立低ランク行列分析に基づく音源分離とその発展
 
楽曲中歌声加工における声質変換精度向上のための歌声・伴奏分離法
楽曲中歌声加工における声質変換精度向上のための歌声・伴奏分離法楽曲中歌声加工における声質変換精度向上のための歌声・伴奏分離法
楽曲中歌声加工における声質変換精度向上のための歌声・伴奏分離法
 
インターネットにおける動画配信の仕組み
インターネットにおける動画配信の仕組みインターネットにおける動画配信の仕組み
インターネットにおける動画配信の仕組み
 
[CEDEC2018] UE4で多数のキャラクターを生かすためのテクニック
[CEDEC2018] UE4で多数のキャラクターを生かすためのテクニック[CEDEC2018] UE4で多数のキャラクターを生かすためのテクニック
[CEDEC2018] UE4で多数のキャラクターを生かすためのテクニック
 
動画配信の基礎知識
動画配信の基礎知識動画配信の基礎知識
動画配信の基礎知識
 
OPTPiX SpriteStudioと他社ツール比較(真)資料1 - 株式会社ウェブテクノロジ - GTMF 2018 OSAKA / TOKYO
OPTPiX SpriteStudioと他社ツール比較(真)資料1 - 株式会社ウェブテクノロジ - GTMF 2018 OSAKA / TOKYOOPTPiX SpriteStudioと他社ツール比較(真)資料1 - 株式会社ウェブテクノロジ - GTMF 2018 OSAKA / TOKYO
OPTPiX SpriteStudioと他社ツール比較(真)資料1 - 株式会社ウェブテクノロジ - GTMF 2018 OSAKA / TOKYO
 
音源分離 ~DNN音源分離の基礎から最新技術まで~ Tokyo bishbash #3
音源分離 ~DNN音源分離の基礎から最新技術まで~ Tokyo bishbash #3音源分離 ~DNN音源分離の基礎から最新技術まで~ Tokyo bishbash #3
音源分離 ~DNN音源分離の基礎から最新技術まで~ Tokyo bishbash #3
 
注目の最新技術「WebRTC」とは? -技術概要と事例紹介-
注目の最新技術「WebRTC」とは? -技術概要と事例紹介-注目の最新技術「WebRTC」とは? -技術概要と事例紹介-
注目の最新技術「WebRTC」とは? -技術概要と事例紹介-
 

ごちゃまぜ歌ボTIPS! 歌うボイスロイドで様々なツールを有効活用しよう!(歌ボWS2)