SlideShare ist ein Scribd-Unternehmen logo
1 von 18
Downloaden Sie, um offline zu lesen
機械学習による健康・疾患
状態の層別化と予測
川上英良
千葉大学大学院 医学研究院 人工知能(AI)医学
千葉大学医学部 治療学人工知能研究センター
理化学研究所 医科学イノベーションハブ推進プログラム
略歴
理化学研究所 医科学イノベーションハブ推進プログラム
健康データ数理推論チーム
教師あり学習 教師なし学習
ランドスケープモデル 位相的データ解析
多項目データから分類・数値を
高い精度で予測
複雑なパターンを抽出し、新た
な分類や基準を発見
健康/疾患状態変化を地形として表現 データが持つ幾何的特徴を抽出
実社会の測定データに基づいて生命現象、健康/疾患状態変化を
理解・予測するための様々な数理科学・機械学習手法を開発・応用
Kawakami et al. 2019 Clin Cancer ResKawakami et al. 2019 Clin Cancer Res
予測・個別化医療に向けた課題
 分類・診断が明確でない疾患が
多い(特に多因子疾患)
 データに基づいた疾患の層別化
が必要
 多くの疾患データは疾患発症後
に病院で取られる
 疾患発症前の履歴、疾患発症後
にどのように進行していくかを
分析する必要がある
卵巣腫瘍の手術前診断
良性腫瘍
悪性腫瘍
早期ガン
(転移・播種がない)
進行ガン
(転移・播種がある)
本来、手術してみなければ分からない
• 良性 or 悪性
• 早期 or 進行
といった卵巣腫瘍の性質を
手術前の血液検査だけから予測する
(慈恵医科大学との共同研究)
http://ovarian.org/about-ovarian-cancer/what-is-ovarian-cancer/types-a-stages より引用
良性
悪性
卵巣腫瘍の良性・悪性判定
良性 101名
悪性 334名
従来の重回帰分析
ランダムフォレスト
accuracy = 86.7%
accuracy = 92.4%
ランダムフォレスト
数千〜数万の決定木の多数決
 外れ値に強い
 分布に依存しない
 変数同士の依存関係を考慮
既知の分類は予測可能なのか
早期がんと進行がんの分類
AUC = 0.760
Accuracy = 69.0%
良性・悪性鑑別に比べて精
度があまり良くない…
 早期がんと進行がんで似てい
る症例がある?
 そもそも早期がんと進行がん
の診断は確実なのか?
➡ 教師なし学習
教師なし学習で
似た症例をグルーピング
• 血液検査パターンが似た症
例が近くに来るように配置
• この時点ではどれが良性・
早期・進行かは教えない
一個一個の点が
症例(患者)
• 良性・早期・進行がどれか
色をつけてみる
本物の元データ
項目ごとにシャッフル
した偽物データ
本物データと偽物データを区別
するためのRandom forestモデ
ルを作る
本物データに含まれる2サンプルが同
じリーフに分類される頻度によって、
サンプルの類似度を計算
2サンプル間の距離 = 1 - 類似度
サンプル間の距離行列を用いてMDS,
tSNEなどで二次元平面に分布描画
教師なしランダムフォレスト
良性腫瘍 早期がん 進行がん
早期がん患者は2つの集団に大別される
集団1: 良性タイプ・・・5年以内にほとんど再発しない。死亡は0。
集団 2: 進行がんタイプ・・・5年以内に1/4程度が再発か死亡。
Kawakami et al. Clin. Cancer Res. 2019
教師なし学習による
早期がん新分類の発見
Ladewig 2013
Nature Reviews Molecular Cell Biology
エピジェネティックランドスケープ
1940年にWaddingtonによって提唱されたコンセプト。細胞分化を、
「ボールが地形上を転がるように状態遷移が起こっていく」という
力学系のアナロジーとして説明。
生命システムの状態を
地形として表現する
石川哲朗
素粒子物理
→認知科学
Adapted from Watanabe & Rees (2017) Nature Communications
2値化
イジングモデルで各状
態の観測頻度とエネル
ギーを対応付ける
高次元
fMRI データ
データに基づくランドスケープ再構成
局所安定状態(local minima)を同定 システムの状態遷移を分析
13
日本最大規模の
健診・レセプトデータベース
https://www.jmdc.co.jp/en/jmdc-claims-database
250万レコードの健診時系列データ
14Physical examination data
健診項目の分布・相関
BM I
GOT(AST)
GPT(ALT)
HbA1 c
HDLコ レ ステロール
LDLコ レ ステロール
γ-GT(γ-GTP)
ヘマト ク リ ッ ト 値
中性脂肪(ト リ グリ セリ ド )
収縮期血圧
尿糖
尿蛋白(定性)
空腹時血糖
腹囲
血色素量(ヘモグロビン値)
赤血球数
-2 0 2
z-value
flag
糖尿病+服薬なし
非糖尿病
糖尿病 + 服薬なし 11,639人
糖尿病 + 服薬あり 16,281人
非糖尿病 289,336人
赤血球数
ヘモグロビン
腹囲
空腹時血糖
尿蛋白
尿糖
収縮期血圧
中性脂肪
ヘマトクリット
γ-GTP
LDLコレステロール
HDLコレステロール
HbA1c
ALT
AST
BMI
1
2
3
54
6
8
7
9
Energy
□
■
1: High
0: Low
空腹時血糖
HbA1c
尿糖
収縮期血圧
腹囲
BMI
ALT
γ-GTP
赤血球
ヘモグロビン
健康
肥満
肥満 +
高血圧 +
多血
糖尿病
肥満 +
高血圧 +
糖尿病
健診データに基づく糖尿病ランドスケープ
肥満+肝機能低下
肥満 +
高血圧 +
糖尿病 +
肝機能低下
肥満 +
高血圧 +
糖尿病 +
多血
肥満 +
高血圧 +
糖尿病 +
肝機能低下 +
多血
●
●
Patient 1 Patient 2
Patient 3 Patient 4
1st exam
Exam
Onset
糖尿病発症過程の代表例
まとめ
 予測・個別化医療に向けて、健康・疾患の状態の層別
化(グループ分け)が重要
 ランドスケープモデルを使うことで、複数のパラメー
タの組み合わせに基づく健康・疾患の状態を表現する
ことができる
 疾患の発症過程、進行過程を追跡することで、適切な
タイミングでの介入、治療選択につながると考えられ
る
@ナガノ
adapted from

Weitere ähnliche Inhalte

Was ist angesagt?

傾向スコア:その概念とRによる実装
傾向スコア:その概念とRによる実装傾向スコア:その概念とRによる実装
傾向スコア:その概念とRによる実装
takehikoihayashi
 
FDRの使い方 (Kashiwa.R #3)
FDRの使い方 (Kashiwa.R #3)FDRの使い方 (Kashiwa.R #3)
FDRの使い方 (Kashiwa.R #3)
Haruka Ozaki
 
不均衡データのクラス分類
不均衡データのクラス分類不均衡データのクラス分類
不均衡データのクラス分類
Shintaro Fukushima
 

Was ist angesagt? (20)

統計的学習理論チュートリアル: 基礎から応用まで (Ibis2012)
統計的学習理論チュートリアル: 基礎から応用まで (Ibis2012)統計的学習理論チュートリアル: 基礎から応用まで (Ibis2012)
統計的学習理論チュートリアル: 基礎から応用まで (Ibis2012)
 
機械学習モデルの判断根拠の説明(Ver.2)
機械学習モデルの判断根拠の説明(Ver.2)機械学習モデルの判断根拠の説明(Ver.2)
機械学習モデルの判断根拠の説明(Ver.2)
 
Deep Learning Lab 異常検知入門
Deep Learning Lab 異常検知入門Deep Learning Lab 異常検知入門
Deep Learning Lab 異常検知入門
 
社会心理学者のための時系列分析入門_小森
社会心理学者のための時系列分析入門_小森社会心理学者のための時系列分析入門_小森
社会心理学者のための時系列分析入門_小森
 
効果測定入門 Rによる傾向スコア解析
効果測定入門  Rによる傾向スコア解析効果測定入門  Rによる傾向スコア解析
効果測定入門 Rによる傾向スコア解析
 
[DL輪読会]Model soups: averaging weights of multiple fine-tuned models improves ...
[DL輪読会]Model soups: averaging weights of multiple fine-tuned models improves ...[DL輪読会]Model soups: averaging weights of multiple fine-tuned models improves ...
[DL輪読会]Model soups: averaging weights of multiple fine-tuned models improves ...
 
SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法
SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法
SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法
 
第7回WBAシンポジウム:予測符号化モデルとしての 深層予測学習とロボット知能化
第7回WBAシンポジウム:予測符号化モデルとしての 深層予測学習とロボット知能化第7回WBAシンポジウム:予測符号化モデルとしての 深層予測学習とロボット知能化
第7回WBAシンポジウム:予測符号化モデルとしての 深層予測学習とロボット知能化
 
傾向スコア:その概念とRによる実装
傾向スコア:その概念とRによる実装傾向スコア:その概念とRによる実装
傾向スコア:その概念とRによる実装
 
心理学におけるベイズ統計の流行を整理する
心理学におけるベイズ統計の流行を整理する心理学におけるベイズ統計の流行を整理する
心理学におけるベイズ統計の流行を整理する
 
FDRの使い方 (Kashiwa.R #3)
FDRの使い方 (Kashiwa.R #3)FDRの使い方 (Kashiwa.R #3)
FDRの使い方 (Kashiwa.R #3)
 
Active Learning と Bayesian Neural Network
Active Learning と Bayesian Neural NetworkActive Learning と Bayesian Neural Network
Active Learning と Bayesian Neural Network
 
データサイエンス概論第一=2-1 データ間の距離と類似度
データサイエンス概論第一=2-1 データ間の距離と類似度データサイエンス概論第一=2-1 データ間の距離と類似度
データサイエンス概論第一=2-1 データ間の距離と類似度
 
[DL輪読会]Pay Attention to MLPs (gMLP)
[DL輪読会]Pay Attention to MLPs	(gMLP)[DL輪読会]Pay Attention to MLPs	(gMLP)
[DL輪読会]Pay Attention to MLPs (gMLP)
 
【DL輪読会】論文解説:Offline Reinforcement Learning as One Big Sequence Modeling Problem
【DL輪読会】論文解説:Offline Reinforcement Learning as One Big Sequence Modeling Problem【DL輪読会】論文解説:Offline Reinforcement Learning as One Big Sequence Modeling Problem
【DL輪読会】論文解説:Offline Reinforcement Learning as One Big Sequence Modeling Problem
 
機械学習工学の進展と課題 2021
機械学習工学の進展と課題 2021機械学習工学の進展と課題 2021
機械学習工学の進展と課題 2021
 
傾向スコアの概念とその実践
傾向スコアの概念とその実践傾向スコアの概念とその実践
傾向スコアの概念とその実践
 
機械学習研究の現状とこれから
機械学習研究の現状とこれから機械学習研究の現状とこれから
機械学習研究の現状とこれから
 
Stanの便利な事後処理関数
Stanの便利な事後処理関数Stanの便利な事後処理関数
Stanの便利な事後処理関数
 
不均衡データのクラス分類
不均衡データのクラス分類不均衡データのクラス分類
不均衡データのクラス分類
 

Ähnlich wie DLLAB Healthcare Day 2020 機械学習による健康・疾患状態の層別化と予測

130528東邦大森・講演会・当日使用
130528東邦大森・講演会・当日使用130528東邦大森・講演会・当日使用
130528東邦大森・講演会・当日使用
Ikegami Keiichi
 

Ähnlich wie DLLAB Healthcare Day 2020 機械学習による健康・疾患状態の層別化と予測 (20)

医療データ解析界隈から見たICLR2017
医療データ解析界隈から見たICLR2017医療データ解析界隈から見たICLR2017
医療データ解析界隈から見たICLR2017
 
次世代ヘルスケアを支えるAIとプラットフォーム:海外事例の紹介
次世代ヘルスケアを支えるAIとプラットフォーム:海外事例の紹介次世代ヘルスケアを支えるAIとプラットフォーム:海外事例の紹介
次世代ヘルスケアを支えるAIとプラットフォーム:海外事例の紹介
 
20151104 health2.0 in Japan - clinical big data and subjects
20151104 health2.0 in Japan - clinical big data and subjects20151104 health2.0 in Japan - clinical big data and subjects
20151104 health2.0 in Japan - clinical big data and subjects
 
20161106予測指標の作り方当日1031 配布版
20161106予測指標の作り方当日1031  配布版20161106予測指標の作り方当日1031  配布版
20161106予測指標の作り方当日1031 配布版
 
労働生産性改善に向けたウェアラブル機器を用いた体調推定法の検討
労働生産性改善に向けたウェアラブル機器を用いた体調推定法の検討労働生産性改善に向けたウェアラブル機器を用いた体調推定法の検討
労働生産性改善に向けたウェアラブル機器を用いた体調推定法の検討
 
03_エピックス.pdf
03_エピックス.pdf03_エピックス.pdf
03_エピックス.pdf
 
Value basedmedicalimaging07222014
Value basedmedicalimaging07222014Value basedmedicalimaging07222014
Value basedmedicalimaging07222014
 
データ解析
データ解析データ解析
データ解析
 
JSME_47th_Nigata
JSME_47th_NigataJSME_47th_Nigata
JSME_47th_Nigata
 
02_In the pink.pdf
02_In the pink.pdf02_In the pink.pdf
02_In the pink.pdf
 
ヘルスケア領域でのDeep Learnigの動向
ヘルスケア領域でのDeep Learnigの動向ヘルスケア領域でのDeep Learnigの動向
ヘルスケア領域でのDeep Learnigの動向
 
医療ビッグデータ勉強会プレゼン公開版
医療ビッグデータ勉強会プレゼン公開版医療ビッグデータ勉強会プレゼン公開版
医療ビッグデータ勉強会プレゼン公開版
 
医学と工学の垣根を越えた医療AI開発
医学と工学の垣根を越えた医療AI開発医学と工学の垣根を越えた医療AI開発
医学と工学の垣根を越えた医療AI開発
 
130528東邦大森・講演会・当日使用
130528東邦大森・講演会・当日使用130528東邦大森・講演会・当日使用
130528東邦大森・講演会・当日使用
 
100919若手病理医からみた医療崩壊
100919若手病理医からみた医療崩壊100919若手病理医からみた医療崩壊
100919若手病理医からみた医療崩壊
 
[DL輪読会]How to develop machine learning models for healthcare
[DL輪読会]How to develop machine learning models for healthcare[DL輪読会]How to develop machine learning models for healthcare
[DL輪読会]How to develop machine learning models for healthcare
 
シリコンバレー比較20171030小柳
シリコンバレー比較20171030小柳シリコンバレー比較20171030小柳
シリコンバレー比較20171030小柳
 
発表スライド
発表スライド発表スライド
発表スライド
 
初めてさわるEC2ロール
初めてさわるEC2ロール初めてさわるEC2ロール
初めてさわるEC2ロール
 
6診断精度のメタアナリシス
6診断精度のメタアナリシス6診断精度のメタアナリシス
6診断精度のメタアナリシス
 

Mehr von Deep Learning Lab(ディープラーニング・ラボ)

Mehr von Deep Learning Lab(ディープラーニング・ラボ) (20)

Edge AI ソリューションを支える Azure IoT サービス
Edge AI ソリューションを支える Azure IoT サービスEdge AI ソリューションを支える Azure IoT サービス
Edge AI ソリューションを支える Azure IoT サービス
 
DLLAB Healthcare Day 2021 Event Report
DLLAB Healthcare Day 2021 Event ReportDLLAB Healthcare Day 2021 Event Report
DLLAB Healthcare Day 2021 Event Report
 
ICTを用いた健康なまちづくりの 取り組みとAI活用への期待​
ICTを用いた健康なまちづくりの 取り組みとAI活用への期待​ICTを用いた健康なまちづくりの 取り組みとAI活用への期待​
ICTを用いた健康なまちづくりの 取り組みとAI活用への期待​
 
Intel AI in Healthcare 各国事例からみるAIとの向き合い方
Intel AI in Healthcare 各国事例からみるAIとの向き合い方Intel AI in Healthcare 各国事例からみるAIとの向き合い方
Intel AI in Healthcare 各国事例からみるAIとの向き合い方
 
厚生労働分野におけるAI技術の利活用について
厚生労働分野におけるAI技術の利活用について厚生労働分野におけるAI技術の利活用について
厚生労働分野におけるAI技術の利活用について
 
先端技術がもたらす「より良いヘルスケアのかたち」
先端技術がもたらす「より良いヘルスケアのかたち」先端技術がもたらす「より良いヘルスケアのかたち」
先端技術がもたらす「より良いヘルスケアのかたち」
 
AIによる細胞診支援技術の紹介と、AI人材が考える医療バイオ領域における参入障壁の乗り越え方
AIによる細胞診支援技術の紹介と、AI人材が考える医療バイオ領域における参入障壁の乗り越え方AIによる細胞診支援技術の紹介と、AI人材が考える医療バイオ領域における参入障壁の乗り越え方
AIによる細胞診支援技術の紹介と、AI人材が考える医療バイオ領域における参入障壁の乗り越え方
 
「言語」×AI Digital Device
「言語」×AI Digital Device「言語」×AI Digital Device
「言語」×AI Digital Device
 
深層強化学習と実装例
深層強化学習と実装例深層強化学習と実装例
深層強化学習と実装例
 
深層強化学習を用いた複合機の搬送制御
深層強化学習を用いた複合機の搬送制御深層強化学習を用いた複合機の搬送制御
深層強化学習を用いた複合機の搬送制御
 
Azure ML 強化学習を用いた最新アルゴリズムの活用手法
Azure ML 強化学習を用いた最新アルゴリズムの活用手法Azure ML 強化学習を用いた最新アルゴリズムの活用手法
Azure ML 強化学習を用いた最新アルゴリズムの活用手法
 
Jetson x Azure ハンズオン DeepStream With Azure IoT 事前準備
Jetson x Azure ハンズオン DeepStream With Azure IoT 事前準備Jetson x Azure ハンズオン DeepStream With Azure IoT 事前準備
Jetson x Azure ハンズオン DeepStream With Azure IoT 事前準備
 
Jetson x Azure ハンズオン DeepStream With Azure IoT
Jetson x Azure ハンズオン DeepStream With Azure IoTJetson x Azure ハンズオン DeepStream With Azure IoT
Jetson x Azure ハンズオン DeepStream With Azure IoT
 
Jetson x Azure ハンズオン DeepStream Azure IoT
Jetson x Azure ハンズオン DeepStream Azure IoTJetson x Azure ハンズオン DeepStream Azure IoT
Jetson x Azure ハンズオン DeepStream Azure IoT
 
Jetson 活用による スタートアップ企業支援
Jetson 活用による スタートアップ企業支援Jetson 活用による スタートアップ企業支援
Jetson 活用による スタートアップ企業支援
 
[Track 4-6] ディープラーニングxものづくりが日本を強くする ~高専DCONの挑戦~
[Track 4-6] ディープラーニングxものづくりが日本を強くする ~高専DCONの挑戦~[Track 4-6] ディープラーニングxものづくりが日本を強くする ~高専DCONの挑戦~
[Track 4-6] ディープラーニングxものづくりが日本を強くする ~高専DCONの挑戦~
 
[Track3-2] AI活用人材の社内育成に関する取り組みについて ~ダイキン情報技術大学~
[Track3-2] AI活用人材の社内育成に関する取り組みについて ~ダイキン情報技術大学~[Track3-2] AI活用人材の社内育成に関する取り組みについて ~ダイキン情報技術大学~
[Track3-2] AI活用人材の社内育成に関する取り組みについて ~ダイキン情報技術大学~
 
[Track1-1] AIの売上予測を発注システムに組み込んだリンガーハットのデータ活用戦略
[Track1-1] AIの売上予測を発注システムに組み込んだリンガーハットのデータ活用戦略[Track1-1] AIの売上予測を発注システムに組み込んだリンガーハットのデータ活用戦略
[Track1-1] AIの売上予測を発注システムに組み込んだリンガーハットのデータ活用戦略
 
[Track1-2] ディープラーニングを用いたワインブドウの収穫量予測
[Track1-2] ディープラーニングを用いたワインブドウの収穫量予測[Track1-2] ディープラーニングを用いたワインブドウの収穫量予測
[Track1-2] ディープラーニングを用いたワインブドウの収穫量予測
 
[Track3-4] アカデミックにおけるAI/ディープラーニング の教育と学習支援に関する研究
[Track3-4] アカデミックにおけるAI/ディープラーニング の教育と学習支援に関する研究[Track3-4] アカデミックにおけるAI/ディープラーニング の教育と学習支援に関する研究
[Track3-4] アカデミックにおけるAI/ディープラーニング の教育と学習支援に関する研究
 

Kürzlich hochgeladen

Kürzlich hochgeladen (10)

Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native IntegrationsUtilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native Integrations
 
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
 
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
 
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
 
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
 
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
 

DLLAB Healthcare Day 2020 機械学習による健康・疾患状態の層別化と予測