SlideShare a Scribd company logo
1 of 28
AI semi
Keio Univ.
Imai Lab.
M1
Keisuke Takiguchi
AI Seminar 2018/10/17
話すこと
• インターンのすすめ
• インターンでやってたこと1
• インターンでやってたこと2
• おまけ(研究進捗)
2
インターンに行きましょう.
3
インターンのすすめ
なぜインターンに行った方が良い?
• 技術,スキルを学べる
• 将来どんな分野で働きたいかのイメージを掴む
• (特に情報工学科は)暇なので
• 研究するか,開発するかの判断材料として
どんなところに行くべき?
• 将来行きたい所(雰囲気調査,あわよくば内定)
• 時給が良い所(責任も大きい→より学べる)
行くならどの時期が良い?
• 夏休み,時間があれば長期インターンを平日に
• B3やM1,時間があるなら他学年でも
4
CycleGAN-
VC
7
声質変換
声質変換とは?
→話者の声を別の話者の声へと変換すること
通常,音響特徴抽出を行う
8
[6]
処理の流れ
9
10
100 25
15 5
メルケプストラム次数による違い
11
original 25 15 5 1
従来研究(1/3)
音響特徴量抽出+音声波形予測
• パラレルデータを用いて学習
• Bidirectional RNNベースのモデルなど
12
DBLSTM-RNN based model
従来研究(2/3)
13
WaveNet
• パラレルデータを用いて学習
• 波形を直接扱う
• 生成が非常に遅い
従来研究(3/3)
14
• フーリエ変換+位相推定による手法
• GAN[1]を用いる手法などがある
• 時系列データである音声特徴を画像として扱うことで
効率よくデータを利用できる.
問題点
WaveNet
• 学習に大量のデータが必要,用意が困難
• 処理が重く,リアルタイムな変換が不可能
STFT+位相推定
• 位相推定に時間を要する
普遍的な問題
• パラレルデータを用意するのが困難
15
CycleGAN[2] (1/2)
16
[2]CycleGAN
CycleGAN[2] (2/2)
17
[2]CycleGAN
CycleGAN-VC
Introduction&Samples
http://www.kecl.ntt.co.jp/people/kaneko.takuhiro/projects/cy
clegan-vc/
18
Architecture
19[4]CycleGAN-VC
1D CNN
20
mfcc
Frame size
結果
21
M to F
original converted
F to M
original converted
GANerated
22
23
GANを用いた三次元位置推定
画像から,三次元の座標を推定する手法
• OpenPoseなどがある
• リアルタイム向きではない(らしい)
24
OpenPose
やりたかったこと
手が写った画像を入力して,手の三次元座標を推定したい
シミュレータで手のモデルを作って,
座標と画像のペアデータを作成,教師データにできる
生成した手の画像が,実世界のものとかけ離れている
手の画像をリアルな質感に変換できれば
精度向上できるのでは
25
GANerated Hands for Real-Time 3D Hand
Tracking from Monocular RGB
26
教師画像生成 三次元位置推定 モデルに適用
処理の流れ
Architecture
27
Result(論文中)
28
おまけ
29
• 階層的な構造を持つ強化学習フレームワークの提案
• 複数の異なる抽象目的を階層的に持つことで
タスクを分解して解釈可能
• サブサンプションアーキテクチャ的な制御
参考文献
[1] Ian J. Goodfellow, Jean Pouget-Abadie, Mehdi Mirza, Bing Xu, David Warde-Farley, Sherjil Ozair, Aaron Courville, Yoshua
Bengio, “Generative Adversarial Networks”, Jun 2014
[2] Jun-Yan Zhu, Taesung Park, Phillip Isola, Alexei A. Efros, ”Unpaired Image-to-Image Translation using Cycle-Consistent
Adversarial Networks”, ICCV 2017.
[3] S M. Ali Eslami, Danilo Jimenez Rezende, et.al. “Neural scene representation and rendering”, Science 15 Jun 2018
[4] Takuhiro Kaneko, Hirokazu Kameoka ,“PARALLEL-DATA-FREE VOICE CONVERSION USING CYCLE-CONSISTENT
ADVERSARIAL NETWORKS”, NTT Corporation
[5] Lifa Sun, Kun Li, Hao Wang, Shiyin Kang and Helen Meng, “PHONETIC POSTERIORGRAMS FOR MANY-TO-ONE VOICE
CONVERSION WITHOUT PARALLEL DATA TRAINING “
[6] 統計的声質変換を行うための知識と手法
https://nico-opendata.jp/ja/casestudy/2stack_voice_conversion/report.html#[4]
[7] 人工知能に関する断創録
http://aidiary.hatenablog.com/
[8]スペクトログラムとメル周波数スペクトログラムの可視化
http://r9y9.github.io/blog/2013/11/16/mel-spectrogram/
30

More Related Content

What's hot

論文のいろは
論文のいろは論文のいろは
論文のいろはShu Sakamoto
 
プレゼンスキルアップ!講座 原田・牛久研究室(日本語)
プレゼンスキルアップ!講座 原田・牛久研究室(日本語)プレゼンスキルアップ!講座 原田・牛久研究室(日本語)
プレゼンスキルアップ!講座 原田・牛久研究室(日本語)Antonio Tejero de Pablos
 
対話の方法論 ~〈対話法〉を使って対話する~
対話の方法論 ~〈対話法〉を使って対話する~対話の方法論 ~〈対話法〉を使って対話する~
対話の方法論 ~〈対話法〉を使って対話する~Philosophy Detective
 
レポートの書き方(基礎演習)
レポートの書き方(基礎演習)レポートの書き方(基礎演習)
レポートの書き方(基礎演習)MunenoriNAGAO
 
演習での発表について
演習での発表について演習での発表について
演習での発表についてMunenoriNAGAO
 
Rediscovery of the presentation(public)
Rediscovery of the presentation(public)Rediscovery of the presentation(public)
Rediscovery of the presentation(public)TAKIMOTO Hiroki
 

What's hot (6)

論文のいろは
論文のいろは論文のいろは
論文のいろは
 
プレゼンスキルアップ!講座 原田・牛久研究室(日本語)
プレゼンスキルアップ!講座 原田・牛久研究室(日本語)プレゼンスキルアップ!講座 原田・牛久研究室(日本語)
プレゼンスキルアップ!講座 原田・牛久研究室(日本語)
 
対話の方法論 ~〈対話法〉を使って対話する~
対話の方法論 ~〈対話法〉を使って対話する~対話の方法論 ~〈対話法〉を使って対話する~
対話の方法論 ~〈対話法〉を使って対話する~
 
レポートの書き方(基礎演習)
レポートの書き方(基礎演習)レポートの書き方(基礎演習)
レポートの書き方(基礎演習)
 
演習での発表について
演習での発表について演習での発表について
演習での発表について
 
Rediscovery of the presentation(public)
Rediscovery of the presentation(public)Rediscovery of the presentation(public)
Rediscovery of the presentation(public)
 

Similar to 機械学習ゼミ 2018/10/17

スライドシェア用 スクリーンテキスト 201307研修効果を最大化ポイントセミナー(人事実務シリーズ2013:wb)
スライドシェア用 スクリーンテキスト 201307研修効果を最大化ポイントセミナー(人事実務シリーズ2013:wb)スライドシェア用 スクリーンテキスト 201307研修効果を最大化ポイントセミナー(人事実務シリーズ2013:wb)
スライドシェア用 スクリーンテキスト 201307研修効果を最大化ポイントセミナー(人事実務シリーズ2013:wb)kkcolumn
 
研修効果の最大化(Jpc wb)
研修効果の最大化(Jpc wb)研修効果の最大化(Jpc wb)
研修効果の最大化(Jpc wb)kkcolumn
 
思考の手引き 〜整理・分析編〜
思考の手引き 〜整理・分析編〜思考の手引き 〜整理・分析編〜
思考の手引き 〜整理・分析編〜tankyu tomonokai
 
2021年度 伊藤ゼミ ゼミと研究
2021年度 伊藤ゼミ ゼミと研究2021年度 伊藤ゼミ ゼミと研究
2021年度 伊藤ゼミ ゼミと研究Masahiko Itoh
 
抄読会2.0
抄読会2.0抄読会2.0
抄読会2.0Siro Kida
 
研究発表をするときの心得
研究発表をするときの心得研究発表をするときの心得
研究発表をするときの心得tatthiy
 
JAM就活キックオフ pdfプレゼン
JAM就活キックオフ pdfプレゼンJAM就活キックオフ pdfプレゼン
JAM就活キックオフ pdfプレゼンKengo Muraguchi
 
新入社員の方による就活体験談と現場での人材育成
新入社員の方による就活体験談と現場での人材育成新入社員の方による就活体験談と現場での人材育成
新入社員の方による就活体験談と現場での人材育成You&I
 
とてか03「「いかす!」のために大事だと思う4つのこと」
とてか03「「いかす!」のために大事だと思う4つのこと」とてか03「「いかす!」のために大事だと思う4つのこと」
とてか03「「いかす!」のために大事だと思う4つのこと」Tsuyoshi Yumoto
 
【9月1日開催】本場スタンフォード大学に学ぶ!デザイン思考入門
【9月1日開催】本場スタンフォード大学に学ぶ!デザイン思考入門【9月1日開催】本場スタンフォード大学に学ぶ!デザイン思考入門
【9月1日開催】本場スタンフォード大学に学ぶ!デザイン思考入門Takanori Kashino
 
20110108 論評ワークショップ(東京メトロポリタンTMC)
20110108 論評ワークショップ(東京メトロポリタンTMC)20110108 論評ワークショップ(東京メトロポリタンTMC)
20110108 論評ワークショップ(東京メトロポリタンTMC)raizo
 
修士の振り返り.pptx
修士の振り返り.pptx修士の振り返り.pptx
修士の振り返り.pptx亮介 西田
 
20120731 江戸tmc table topics workshop
20120731 江戸tmc table topics workshop20120731 江戸tmc table topics workshop
20120731 江戸tmc table topics workshopKiminari Azuma
 
2011論評ワークショップ(東京m)予告編
2011論評ワークショップ(東京m)予告編2011論評ワークショップ(東京m)予告編
2011論評ワークショップ(東京m)予告編raizo
 
『Toi toitoiケース研究月例会』説明資料
『Toi toitoiケース研究月例会』説明資料『Toi toitoiケース研究月例会』説明資料
『Toi toitoiケース研究月例会』説明資料Keiichi Yokoyama
 
実践の手引き ~課題研究編~
実践の手引き ~課題研究編~実践の手引き ~課題研究編~
実践の手引き ~課題研究編~tankyu tomonokai
 
北海学園英語教育研究会第4回研究会特別セミナースライド
北海学園英語教育研究会第4回研究会特別セミナースライド北海学園英語教育研究会第4回研究会特別セミナースライド
北海学園英語教育研究会第4回研究会特別セミナースライドKazuhito Yamato
 

Similar to 機械学習ゼミ 2018/10/17 (20)

スライドシェア用 スクリーンテキスト 201307研修効果を最大化ポイントセミナー(人事実務シリーズ2013:wb)
スライドシェア用 スクリーンテキスト 201307研修効果を最大化ポイントセミナー(人事実務シリーズ2013:wb)スライドシェア用 スクリーンテキスト 201307研修効果を最大化ポイントセミナー(人事実務シリーズ2013:wb)
スライドシェア用 スクリーンテキスト 201307研修効果を最大化ポイントセミナー(人事実務シリーズ2013:wb)
 
研修効果の最大化(Jpc wb)
研修効果の最大化(Jpc wb)研修効果の最大化(Jpc wb)
研修効果の最大化(Jpc wb)
 
思考の手引き 〜整理・分析編〜
思考の手引き 〜整理・分析編〜思考の手引き 〜整理・分析編〜
思考の手引き 〜整理・分析編〜
 
2021年度 伊藤ゼミ ゼミと研究
2021年度 伊藤ゼミ ゼミと研究2021年度 伊藤ゼミ ゼミと研究
2021年度 伊藤ゼミ ゼミと研究
 
プレゼンテーションの考え方20140628
プレゼンテーションの考え方20140628プレゼンテーションの考え方20140628
プレゼンテーションの考え方20140628
 
抄読会2.0
抄読会2.0抄読会2.0
抄読会2.0
 
プレゼンテーションの考え方20130616
プレゼンテーションの考え方20130616プレゼンテーションの考え方20130616
プレゼンテーションの考え方20130616
 
研究発表をするときの心得
研究発表をするときの心得研究発表をするときの心得
研究発表をするときの心得
 
JAM就活キックオフ pdfプレゼン
JAM就活キックオフ pdfプレゼンJAM就活キックオフ pdfプレゼン
JAM就活キックオフ pdfプレゼン
 
新入社員の方による就活体験談と現場での人材育成
新入社員の方による就活体験談と現場での人材育成新入社員の方による就活体験談と現場での人材育成
新入社員の方による就活体験談と現場での人材育成
 
とてか03「「いかす!」のために大事だと思う4つのこと」
とてか03「「いかす!」のために大事だと思う4つのこと」とてか03「「いかす!」のために大事だと思う4つのこと」
とてか03「「いかす!」のために大事だと思う4つのこと」
 
【9月1日開催】本場スタンフォード大学に学ぶ!デザイン思考入門
【9月1日開催】本場スタンフォード大学に学ぶ!デザイン思考入門【9月1日開催】本場スタンフォード大学に学ぶ!デザイン思考入門
【9月1日開催】本場スタンフォード大学に学ぶ!デザイン思考入門
 
20110108 論評ワークショップ(東京メトロポリタンTMC)
20110108 論評ワークショップ(東京メトロポリタンTMC)20110108 論評ワークショップ(東京メトロポリタンTMC)
20110108 論評ワークショップ(東京メトロポリタンTMC)
 
修士の振り返り.pptx
修士の振り返り.pptx修士の振り返り.pptx
修士の振り返り.pptx
 
20120731 江戸tmc table topics workshop
20120731 江戸tmc table topics workshop20120731 江戸tmc table topics workshop
20120731 江戸tmc table topics workshop
 
2011論評ワークショップ(東京m)予告編
2011論評ワークショップ(東京m)予告編2011論評ワークショップ(東京m)予告編
2011論評ワークショップ(東京m)予告編
 
Jacet2014ykondo_final
Jacet2014ykondo_finalJacet2014ykondo_final
Jacet2014ykondo_final
 
『Toi toitoiケース研究月例会』説明資料
『Toi toitoiケース研究月例会』説明資料『Toi toitoiケース研究月例会』説明資料
『Toi toitoiケース研究月例会』説明資料
 
実践の手引き ~課題研究編~
実践の手引き ~課題研究編~実践の手引き ~課題研究編~
実践の手引き ~課題研究編~
 
北海学園英語教育研究会第4回研究会特別セミナースライド
北海学園英語教育研究会第4回研究会特別セミナースライド北海学園英語教育研究会第4回研究会特別セミナースライド
北海学園英語教育研究会第4回研究会特別セミナースライド
 

More from KCS Keio Computer Society

Large scale gan training for high fidelity natural
Large scale gan training for high fidelity naturalLarge scale gan training for high fidelity natural
Large scale gan training for high fidelity naturalKCS Keio Computer Society
 
Vector-Based navigation using grid-like representations in artificial agents
 Vector-Based navigation using grid-like representations in artificial agents Vector-Based navigation using grid-like representations in artificial agents
Vector-Based navigation using grid-like representations in artificial agentsKCS Keio Computer Society
 
ゼロから作るDeepLearning 2~3章 輪読
ゼロから作るDeepLearning 2~3章 輪読ゼロから作るDeepLearning 2~3章 輪読
ゼロから作るDeepLearning 2~3章 輪読KCS Keio Computer Society
 
ゼロから作るDeepLearning 3.3~3.6章 輪読
ゼロから作るDeepLearning 3.3~3.6章 輪読ゼロから作るDeepLearning 3.3~3.6章 輪読
ゼロから作るDeepLearning 3.3~3.6章 輪読KCS Keio Computer Society
 
[論文略説]Stochastic Thermodynamics Interpretation of Information Geometry
[論文略説]Stochastic Thermodynamics Interpretation of Information Geometry[論文略説]Stochastic Thermodynamics Interpretation of Information Geometry
[論文略説]Stochastic Thermodynamics Interpretation of Information GeometryKCS Keio Computer Society
 

More from KCS Keio Computer Society (20)

Large scale gan training for high fidelity natural
Large scale gan training for high fidelity naturalLarge scale gan training for high fidelity natural
Large scale gan training for high fidelity natural
 
Imagenet trained cnns-are_biased_towards
Imagenet trained cnns-are_biased_towardsImagenet trained cnns-are_biased_towards
Imagenet trained cnns-are_biased_towards
 
機械学習ゼミ: Area attenttion
機械学習ゼミ: Area attenttion機械学習ゼミ: Area attenttion
機械学習ゼミ: Area attenttion
 
機械学習ゼミ2018 06 15
機械学習ゼミ2018 06 15機械学習ゼミ2018 06 15
機械学習ゼミ2018 06 15
 
Control by deep learning
Control by deep learningControl by deep learning
Control by deep learning
 
深層学習 第6章
深層学習 第6章深層学習 第6章
深層学習 第6章
 
Vector-Based navigation using grid-like representations in artificial agents
 Vector-Based navigation using grid-like representations in artificial agents Vector-Based navigation using grid-like representations in artificial agents
Vector-Based navigation using grid-like representations in artificial agents
 
文章生成の未解決問題
文章生成の未解決問題文章生成の未解決問題
文章生成の未解決問題
 
Word2vec alpha
Word2vec alphaWord2vec alpha
Word2vec alpha
 
テンソル代数
テンソル代数テンソル代数
テンソル代数
 
Hindsight experience replay
Hindsight experience replayHindsight experience replay
Hindsight experience replay
 
Kml 輪読514
Kml 輪読514Kml 輪読514
Kml 輪読514
 
ゼロから作るDeepLearning 5章 輪読
ゼロから作るDeepLearning 5章 輪読ゼロから作るDeepLearning 5章 輪読
ゼロから作るDeepLearning 5章 輪読
 
ELBO型VAEのダメなところ
ELBO型VAEのダメなところELBO型VAEのダメなところ
ELBO型VAEのダメなところ
 
ゼロから作るDeepLearning 2~3章 輪読
ゼロから作るDeepLearning 2~3章 輪読ゼロから作るDeepLearning 2~3章 輪読
ゼロから作るDeepLearning 2~3章 輪読
 
ゼロから作るDeepLearning 4章 輪読
ゼロから作るDeepLearning 4章 輪読ゼロから作るDeepLearning 4章 輪読
ゼロから作るDeepLearning 4章 輪読
 
Soft Actor Critic 解説
Soft Actor Critic 解説Soft Actor Critic 解説
Soft Actor Critic 解説
 
ゼロから作るDeepLearning 3.3~3.6章 輪読
ゼロから作るDeepLearning 3.3~3.6章 輪読ゼロから作るDeepLearning 3.3~3.6章 輪読
ゼロから作るDeepLearning 3.3~3.6章 輪読
 
[論文略説]Stochastic Thermodynamics Interpretation of Information Geometry
[論文略説]Stochastic Thermodynamics Interpretation of Information Geometry[論文略説]Stochastic Thermodynamics Interpretation of Information Geometry
[論文略説]Stochastic Thermodynamics Interpretation of Information Geometry
 
Graph Convolutional Network 概説
Graph Convolutional Network 概説Graph Convolutional Network 概説
Graph Convolutional Network 概説
 

機械学習ゼミ 2018/10/17

Editor's Notes

  1. 質疑応答,機械学習のことだけじゃなくて,インターンのことでも大丈夫です.AIゼミ的に大丈夫かは知らないです.
  2. こっから本題.
  3. パラレルデータとは,入力話者と出力話者について同時に同じ内容を発話した音声データのことをいう Bidirectional RNN 音響特徴量(基本周波数、スペクトラム、非周期信号
  4. 大量の計算資源と大量の学習データが必要 16-bitの整数値で保存される. つまり取りうる値を生成するために, 1タイムステップあたり65,536個の確率をアウトプット データを用意するのが困難.
  5. 音質わるわる