SlideShare ist ein Scribd-Unternehmen logo
1 von 20
Juliaで音声信号処理を
しばらくやってみた
山本りゅういち (@r9y9)
2015/04/25 JuliaTokyo #3
ノートブックとか: https://github.com/r9y9/JuliaTokyo3
自己紹介
• 山本りゅういち (@r9y9)
– 音声/音楽の信号処理、機械学習が好き
– コンピュータビジョン(初心者)
– Julia歴 8ヶ月くらい
• ブログ
– LESS IS MORE http://r9y9.github.io/
今日の話
1. 音声信号処理に便利なパッケージの紹介
2. 僕が書いたパッケージの紹介
dancasimiro/WAV.jl
https://github.com/dancasimiro/WAV.jl
WAVファイルの読み込み
using WAV
x, fs = wavread("test16k.wav")
JuliaDSP/DSP.jl
https://github.com/JuliaDSP/DSP.jl
スペクトログラム
バンドパスフィルタを掛ける
r9y9/WORLD.jl
https://github.com/r9y9/WORLD.jl
基本周波数 (Fundamental Frequency; F0)
スペクトル包絡 (Spectrum Envelope)
非周期性指標 (Aperiodicity ratio)
音声波形の再合成
※誤差は、分析条件、分析方法に依存します
WORLDの良いところ
• 高品質
– 業界デファクトのSTRAIGHTと同等
• BSDライセンス
• 高速
応用
Robust PCA による歌声分離
混合音のスペクトログラム
低ランク行列
スパースな行列 (歌声)
Huang, Po-Sen, et al. "Singing-voice separation from monaural recordings using
robust principal component analysis." ICASSP 2012.
https://github.com/r9y9/RobustPCA.jl
統計的声質変換
http://r9y9.github.io/blog/2014/11/12/statistical-voice-conversion-code/
画像+スペクトログラム
所感
• 既存のCライブラリを活用したい場合にラッパーを書く
– ccall かんたん 慣れれば簡単に感じます(当たり前
• Juliaは本当に速かった
– 例えば反復計算を含むアルゴリズムで、C実装のたかだか1.3倍程度
– https://github.com/r9y9/MelGeneralizedCepstrums.jl/blob/35feece
580fb121803ed6ace7f80e6b694c9aa69/perf/mgcep.jl
• 音声信号処理全然できるよ!
• パッケージは必要なら自分で書く!!
僕が音声系で使う/作ったパッケージ一覧
• dancasimiro/WAV WAVファイルの読み込み
• JuliaDSP/DSP 窓関数、スペクトログラム、STFT、デジタルフィル
タ
• r9y9/WORLD 音声分析・合成フレームワーク
• r9y9/MelGeneralizedCepstrums メル一般化ケプストラム分析
r9y9/SynthesisFilters メル一般化ケプストラムからの波形合成
• r9y9/SPTK 音声信号処理ツールキット
• r9y9/RobustPCA ロバスト主成分分析(歌声分離へ応用)
• r9y9/REAPER 基本周波数推定
• r9y9/VoiceConversion 統計的声質変換
※発表中に紹介しなかったものも含む。僕が書いた公式パッケージは現在 WORLDのみです。
上から順に、汎用的(だと思います)

Weitere ähnliche Inhalte

Was ist angesagt?

2014.05.31.中国firefox os勉強会 pub
2014.05.31.中国firefox os勉強会 pub2014.05.31.中国firefox os勉強会 pub
2014.05.31.中国firefox os勉強会 pubTakahiro Uemura
 
5歳児から覚える情報リテラシー教育(第1回目 ぱそこんをつかえるようになろう!)
5歳児から覚える情報リテラシー教育(第1回目 ぱそこんをつかえるようになろう!)5歳児から覚える情報リテラシー教育(第1回目 ぱそこんをつかえるようになろう!)
5歳児から覚える情報リテラシー教育(第1回目 ぱそこんをつかえるようになろう!)Yosuke Nakao
 
Python東海の紹介.py
Python東海の紹介.pyPython東海の紹介.py
Python東海の紹介.py2bo 2bo
 
自作音楽ゲームの開発と設計
自作音楽ゲームの開発と設計自作音楽ゲームの開発と設計
自作音楽ゲームの開発と設計Daisuke Mizuno
 
しゃべれて回れる「小人の執事さん」ったら地獄耳でもあるみたいですよ?(前編)
しゃべれて回れる「小人の執事さん」ったら地獄耳でもあるみたいですよ?(前編)しゃべれて回れる「小人の執事さん」ったら地獄耳でもあるみたいですよ?(前編)
しゃべれて回れる「小人の執事さん」ったら地獄耳でもあるみたいですよ?(前編)Kazuhito Miura
 
原典にあたったら英語も勉強できた話 〜 Git編 〜
原典にあたったら英語も勉強できた話 〜 Git編 〜原典にあたったら英語も勉強できた話 〜 Git編 〜
原典にあたったら英語も勉強できた話 〜 Git編 〜Yukinori KITADAI
 
フリー音源でヘヴィーなギターを作る
フリー音源でヘヴィーなギターを作るフリー音源でヘヴィーなギターを作る
フリー音源でヘヴィーなギターを作るMoyashigroove
 
簡易TRPG向けチャットツールOnset!
簡易TRPG向けチャットツールOnset!簡易TRPG向けチャットツールOnset!
簡易TRPG向けチャットツールOnset!kiridaruma
 
あひる焼きの歴史 ver0.1
あひる焼きの歴史 ver0.1あひる焼きの歴史 ver0.1
あひる焼きの歴史 ver0.12bo 2bo
 
tWitter
tWittertWitter
tWitter10v028
 
Pyenvで幸せになろう.py
Pyenvで幸せになろう.pyPyenvで幸せになろう.py
Pyenvで幸せになろう.py2bo 2bo
 
NPCA-LT hideo54[OSC Kyoto 2014]
NPCA-LT hideo54[OSC Kyoto 2014]NPCA-LT hideo54[OSC Kyoto 2014]
NPCA-LT hideo54[OSC Kyoto 2014]Hideo Yasumoto
 
Power Apps + Power Automate = Baby monitor
Power Apps + Power Automate = Baby monitorPower Apps + Power Automate = Baby monitor
Power Apps + Power Automate = Baby monitorNagao Hiroaki
 
コンピュータフォレンジックにちょっとだけ触れてみる
コンピュータフォレンジックにちょっとだけ触れてみるコンピュータフォレンジックにちょっとだけ触れてみる
コンピュータフォレンジックにちょっとだけ触れてみるinfinite_loop
 
音ゲーマーの憂鬱
音ゲーマーの憂鬱音ゲーマーの憂鬱
音ゲーマーの憂鬱monochrojazz
 
Pythonistaで音ゲーを作る
Pythonistaで音ゲーを作るPythonistaで音ゲーを作る
Pythonistaで音ゲーを作るmonochrojazz
 
5分間ラズパイオーディオLT-東海道らぐ編-
5分間ラズパイオーディオLT-東海道らぐ編-5分間ラズパイオーディオLT-東海道らぐ編-
5分間ラズパイオーディオLT-東海道らぐ編-Takeshi Matsumoto
 
Pythonスタートアップ勉強会201109 python入門
Pythonスタートアップ勉強会201109 python入門Pythonスタートアップ勉強会201109 python入門
Pythonスタートアップ勉強会201109 python入門Takayuki Shimizukawa
 
HubotとChatOpsについて語るBoF
HubotとChatOpsについて語るBoFHubotとChatOpsについて語るBoF
HubotとChatOpsについて語るBoFAkihiko Horiuchi
 

Was ist angesagt? (20)

2014.05.31.中国firefox os勉強会 pub
2014.05.31.中国firefox os勉強会 pub2014.05.31.中国firefox os勉強会 pub
2014.05.31.中国firefox os勉強会 pub
 
5歳児から覚える情報リテラシー教育(第1回目 ぱそこんをつかえるようになろう!)
5歳児から覚える情報リテラシー教育(第1回目 ぱそこんをつかえるようになろう!)5歳児から覚える情報リテラシー教育(第1回目 ぱそこんをつかえるようになろう!)
5歳児から覚える情報リテラシー教育(第1回目 ぱそこんをつかえるようになろう!)
 
Python東海の紹介.py
Python東海の紹介.pyPython東海の紹介.py
Python東海の紹介.py
 
Pythonのすすめ
PythonのすすめPythonのすすめ
Pythonのすすめ
 
自作音楽ゲームの開発と設計
自作音楽ゲームの開発と設計自作音楽ゲームの開発と設計
自作音楽ゲームの開発と設計
 
しゃべれて回れる「小人の執事さん」ったら地獄耳でもあるみたいですよ?(前編)
しゃべれて回れる「小人の執事さん」ったら地獄耳でもあるみたいですよ?(前編)しゃべれて回れる「小人の執事さん」ったら地獄耳でもあるみたいですよ?(前編)
しゃべれて回れる「小人の執事さん」ったら地獄耳でもあるみたいですよ?(前編)
 
原典にあたったら英語も勉強できた話 〜 Git編 〜
原典にあたったら英語も勉強できた話 〜 Git編 〜原典にあたったら英語も勉強できた話 〜 Git編 〜
原典にあたったら英語も勉強できた話 〜 Git編 〜
 
フリー音源でヘヴィーなギターを作る
フリー音源でヘヴィーなギターを作るフリー音源でヘヴィーなギターを作る
フリー音源でヘヴィーなギターを作る
 
簡易TRPG向けチャットツールOnset!
簡易TRPG向けチャットツールOnset!簡易TRPG向けチャットツールOnset!
簡易TRPG向けチャットツールOnset!
 
あひる焼きの歴史 ver0.1
あひる焼きの歴史 ver0.1あひる焼きの歴史 ver0.1
あひる焼きの歴史 ver0.1
 
tWitter
tWittertWitter
tWitter
 
Pyenvで幸せになろう.py
Pyenvで幸せになろう.pyPyenvで幸せになろう.py
Pyenvで幸せになろう.py
 
NPCA-LT hideo54[OSC Kyoto 2014]
NPCA-LT hideo54[OSC Kyoto 2014]NPCA-LT hideo54[OSC Kyoto 2014]
NPCA-LT hideo54[OSC Kyoto 2014]
 
Power Apps + Power Automate = Baby monitor
Power Apps + Power Automate = Baby monitorPower Apps + Power Automate = Baby monitor
Power Apps + Power Automate = Baby monitor
 
コンピュータフォレンジックにちょっとだけ触れてみる
コンピュータフォレンジックにちょっとだけ触れてみるコンピュータフォレンジックにちょっとだけ触れてみる
コンピュータフォレンジックにちょっとだけ触れてみる
 
音ゲーマーの憂鬱
音ゲーマーの憂鬱音ゲーマーの憂鬱
音ゲーマーの憂鬱
 
Pythonistaで音ゲーを作る
Pythonistaで音ゲーを作るPythonistaで音ゲーを作る
Pythonistaで音ゲーを作る
 
5分間ラズパイオーディオLT-東海道らぐ編-
5分間ラズパイオーディオLT-東海道らぐ編-5分間ラズパイオーディオLT-東海道らぐ編-
5分間ラズパイオーディオLT-東海道らぐ編-
 
Pythonスタートアップ勉強会201109 python入門
Pythonスタートアップ勉強会201109 python入門Pythonスタートアップ勉強会201109 python入門
Pythonスタートアップ勉強会201109 python入門
 
HubotとChatOpsについて語るBoF
HubotとChatOpsについて語るBoFHubotとChatOpsについて語るBoF
HubotとChatOpsについて語るBoF
 

Andere mochten auch

Welcome to the Neighborhood
Welcome to the NeighborhoodWelcome to the Neighborhood
Welcome to the NeighborhoodMorgan Appel
 
Introdution of the seoul institute
Introdution of the seoul instituteIntrodution of the seoul institute
Introdution of the seoul institutesimrc
 
How to Make Your Organisation More Agile - J. Boye Conference 20141105
How to Make Your Organisation More Agile - J. Boye Conference 20141105How to Make Your Organisation More Agile - J. Boye Conference 20141105
How to Make Your Organisation More Agile - J. Boye Conference 20141105Karoliina Luoto
 
What software companies can learn from shopping centres
What software companies can learn from shopping centresWhat software companies can learn from shopping centres
What software companies can learn from shopping centresIntercom
 
Ipsos MORI Political Monitor - November 2016
Ipsos MORI Political Monitor - November 2016Ipsos MORI Political Monitor - November 2016
Ipsos MORI Political Monitor - November 2016Ipsos UK
 
SORACOM Conference "Discovery" | (A3)SORACOM のグローバル展開
SORACOM Conference "Discovery" | (A3)SORACOM のグローバル展開SORACOM Conference "Discovery" | (A3)SORACOM のグローバル展開
SORACOM Conference "Discovery" | (A3)SORACOM のグローバル展開SORACOM,INC
 
Ipsos MORI Political Monitor July 2016
Ipsos MORI Political Monitor July 2016Ipsos MORI Political Monitor July 2016
Ipsos MORI Political Monitor July 2016Ipsos UK
 
Makanan tradisional
Makanan tradisionalMakanan tradisional
Makanan tradisionalBmaida10
 
Super Powered SEO Tips for Auto Dealers
Super Powered SEO Tips for Auto DealersSuper Powered SEO Tips for Auto Dealers
Super Powered SEO Tips for Auto DealersGreg Gifford
 
Chef & OpenStack: OSCON 2014
Chef & OpenStack: OSCON 2014Chef & OpenStack: OSCON 2014
Chef & OpenStack: OSCON 2014Matt Ray
 
The BARE Essentials of Digital Marketing by Rich Brooks
The BARE Essentials of Digital Marketing by Rich BrooksThe BARE Essentials of Digital Marketing by Rich Brooks
The BARE Essentials of Digital Marketing by Rich BrooksOrbit Media Studios
 
20160426 AIIM16 CIP Preconference Briefing
20160426 AIIM16 CIP Preconference Briefing20160426 AIIM16 CIP Preconference Briefing
20160426 AIIM16 CIP Preconference BriefingJesse Wilkins
 
سئو و بهینه سازی سایت به زبان ساده قسمت اول
سئو و بهینه سازی سایت به زبان ساده قسمت اولسئو و بهینه سازی سایت به زبان ساده قسمت اول
سئو و بهینه سازی سایت به زبان ساده قسمت اولkasra khoshkhooy
 
Gazpacho recipe olmeda origenes best spanish food
Gazpacho recipe olmeda origenes best spanish foodGazpacho recipe olmeda origenes best spanish food
Gazpacho recipe olmeda origenes best spanish foodOlmeda Orígenes
 

Andere mochten auch (16)

Juliaで並列計算
Juliaで並列計算Juliaで並列計算
Juliaで並列計算
 
Welcome to the Neighborhood
Welcome to the NeighborhoodWelcome to the Neighborhood
Welcome to the Neighborhood
 
Introdution of the seoul institute
Introdution of the seoul instituteIntrodution of the seoul institute
Introdution of the seoul institute
 
How to Make Your Organisation More Agile - J. Boye Conference 20141105
How to Make Your Organisation More Agile - J. Boye Conference 20141105How to Make Your Organisation More Agile - J. Boye Conference 20141105
How to Make Your Organisation More Agile - J. Boye Conference 20141105
 
What software companies can learn from shopping centres
What software companies can learn from shopping centresWhat software companies can learn from shopping centres
What software companies can learn from shopping centres
 
Ipsos MORI Political Monitor - November 2016
Ipsos MORI Political Monitor - November 2016Ipsos MORI Political Monitor - November 2016
Ipsos MORI Political Monitor - November 2016
 
SORACOM Conference "Discovery" | (A3)SORACOM のグローバル展開
SORACOM Conference "Discovery" | (A3)SORACOM のグローバル展開SORACOM Conference "Discovery" | (A3)SORACOM のグローバル展開
SORACOM Conference "Discovery" | (A3)SORACOM のグローバル展開
 
Ipsos MORI Political Monitor July 2016
Ipsos MORI Political Monitor July 2016Ipsos MORI Political Monitor July 2016
Ipsos MORI Political Monitor July 2016
 
Makanan tradisional
Makanan tradisionalMakanan tradisional
Makanan tradisional
 
Super Powered SEO Tips for Auto Dealers
Super Powered SEO Tips for Auto DealersSuper Powered SEO Tips for Auto Dealers
Super Powered SEO Tips for Auto Dealers
 
Chef & OpenStack: OSCON 2014
Chef & OpenStack: OSCON 2014Chef & OpenStack: OSCON 2014
Chef & OpenStack: OSCON 2014
 
The BARE Essentials of Digital Marketing by Rich Brooks
The BARE Essentials of Digital Marketing by Rich BrooksThe BARE Essentials of Digital Marketing by Rich Brooks
The BARE Essentials of Digital Marketing by Rich Brooks
 
20160426 AIIM16 CIP Preconference Briefing
20160426 AIIM16 CIP Preconference Briefing20160426 AIIM16 CIP Preconference Briefing
20160426 AIIM16 CIP Preconference Briefing
 
Yoshis caanoo emulator_fact_sheets_v03
Yoshis caanoo emulator_fact_sheets_v03Yoshis caanoo emulator_fact_sheets_v03
Yoshis caanoo emulator_fact_sheets_v03
 
سئو و بهینه سازی سایت به زبان ساده قسمت اول
سئو و بهینه سازی سایت به زبان ساده قسمت اولسئو و بهینه سازی سایت به زبان ساده قسمت اول
سئو و بهینه سازی سایت به زبان ساده قسمت اول
 
Gazpacho recipe olmeda origenes best spanish food
Gazpacho recipe olmeda origenes best spanish foodGazpacho recipe olmeda origenes best spanish food
Gazpacho recipe olmeda origenes best spanish food
 

Kürzlich hochgeladen

論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNetToru Tamaki
 
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...Toru Tamaki
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)Hiroki Ichikura
 
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムスマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムsugiuralab
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものですiPride Co., Ltd.
 
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdftaisei2219
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A surveyToru Tamaki
 
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略Ryo Sasaki
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Yuma Ohgami
 

Kürzlich hochgeladen (9)

論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet
 
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
 
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムスマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システム
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
 
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdf
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey
 
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
 

JuliaTokyo #3 Speech Signal Processing in Julia