17. A deep learning method for pathological voice detection
using convolutional deep belief networks
• Wu, Huiyi and Soraghan, John and Lowit, Anja and Di Caterina,
Gaetano (2018) , Interspeech
• 「病理学的音声障害の検出分野ではDNNの研究はあまり行われていない」
• 大規模データセットがないため。そこで、大域最小値を正確に達成するため
の事前学習DNNのための教師なし手法としてRestricted Boltzmann
Machine (RBM)を利用する。
• 提案手法:正常音声と病的音声のspectrogramを入力とするCNNを基本とし
たアーキテクチャ。過学習を防ぐため、最初にCDBNでCNNの重みを事前
学習する。
17
18. A deep learning method for pathological voice detection
using convolutional deep belief networks
• CDBNは重みを初期化し、システムをより強固にできるが、ロバスト性と精度はト
レードオフの関係にあるという課題は依然として残る。 18
19. 肺炎を声から診断する研究はあったのか?
• Coswara -- A Database of Breathing, Cough, and Voice Sounds for COVID-19
Diagnosis (Sharma 2020)
– COVID-19は咳と呼吸困難が顕著な症状だとして、呼吸音(咳。呼吸、音)のデータベース
Coswaraを作成中。クラウドソーシングで収集中。
– 「呼吸器感染症では呼吸器系の物理構造変化が起こるため、咳音から病状分離が可能」
– 音声データは:呼吸(浅い/深い)、咳(軽い/キツい)、母音の持続音韻(æ I u:)、1~20桁までのカウ
ント(普通に/速く)
– 百日咳や慢性閉塞性疾患、結核菌などに関しての研究は既に他の研究で試みられており、喘
息等の検知で精度の高いものが存在(DNNではない)
– COVID-19の検出・診断に関してはケンブリッジ、CMU、Wadhwani AI Institute、EPFLのプロジェ
クトで研究中
19
ちなみに、arXivで4月時にはなかったこんな憑依jがされるようになっていた