SlideShare ist ein Scribd-Unternehmen logo
1 von 41
Downloaden Sie, um offline zu lesen
Medical Deep Learning
through data-driven
Produced By Tae Young Lee
2014 2015 20172016
[제88회 Open
Technet]
오픈소스 딥러닝
프레임워크
제작하기
[SK Planet]
TensorFlow 기본
AutoML & AutoD
raw
[SK T academy]
딥러닝을 위한
TensorFlow
Sequence Model
and the RNN API
Machine Learning
In SPAM
Python Network
Programming
Neural Network의
변천사를 통해 바라
본 R에서 Deep Ne
ural Net활용
Change the world
in IOT (Falinux)
Game based on t
he IOT (KGC)
심근 경색 예측
物質代謝
의학정보
의료기술
의료기기
진단
협진
의료연구
의학정보
이집트에서 가장 오래된 묘사는 기원전
3000 년경으로 거슬러 올라갑니다. 그것은
에드윈 스미스 파피루스 (Edwin Smith
Papyrus)라고 불리우며 외상 수술에 관한
고대 이집트 교과서의 사본입니다. Fire
Drill이라고 불리는 도구를 사용하여 소작
술 한 8 개의 종양이나 유방 궤양에 대해
설명함
Hippocrates (460-370 처음으로 불렸습니
다 암에게. 그는 여겨집니다 Hippocrates는
기간 carcinos 및 비 궤양 형성 및 궤양 형
성 종양을 기술하기 위하여 암을 이용했습
니다. 그리스어에서 이것은 crab을 의미
19 세기
Rudolf Virchow는 종종 세포 병리학의
창시자라고 불리며, 현미경으로 암의 병
리학 적 연구를위한 기초를 마련했습니
다. Virchow는 병에 현미경 병리를 연관
시켰다.
1860 년대에 독일의 외과의사인 Karl
Thiersch는 암은 액체가 아닌 악성 세포
의 전이를 통해 전이한다는 것을 보여주
었습니다.
암 검진은 조기 발견에 도움이됩니다. 암
으로 널리 사용되는 첫 번째 선별 검사는
팹 테스트 (Pap test)였습니다. 그것은 생
리주기를 이해하는 연구 방법으로
George Papanicolaou가 개발했습니다.
그는이 검사가 자궁 경부암을 조기 발견
하는 데 도움이 될 수 있으며 1923 년에
발견 한 사실을 지적했다.
스코틀랜드의 외과 의사 John Hunter
(1728-1793)는 수술로 일부 암이 완치 될
수 있다고 제안했습니다.
마취의 발달로 다른 장기로 전이되지 않
은 "움직일 수있는"암에 대한 정기적 인
수술이 시작된 것은 거의 1 세기 후였다.
진단
협진
의료연구 기간계 : OCS (Order Communication System)
EMR(Electronic Medical Record), PACS - 전자차트
정보계 : DW, OLAP, CDSS(Clinical Decision Support System)
연 계 : DUR(의약품안전정보), NEDIS(응급환자진료정보망)
의료기기
목적하는 부위를 선택하고
나머지는 제거한다
이중 염색
인화지에 복사된 그림으로 정보 획득
환자별로 파일 정리
PACS
(Picture Archiving & Communication System)
•ACQ (획득서버)
•HIS (연계서버)
•WEB (웹서버)
•GATEWAY (연동장치)
•VIEWER (뷰어)
•STORAGE (저장장치)
의료기술
CVR (Critical Value Report) EHR (Electrical Health Record)
Human Metabolism(物質代謝)
물질대사 : 생물체 내의 화학반응 ( 물질합성/분해 for E출입)
Deep Learning Many Data
All of them
변하는 요인들을 예측하기 위해
가장 필요한 것은
의료 표준
CT vs MRI
조영제
인공 지능을 활용하여 의료 영상 판독의 정확도를
높일 수 있음
흉부 엑스레이에서 폐암 진단
The Perspective of Data Flow
Data Selection Data CleaningStreaming Data Data Augmentation
Data Pre-Processing
Feature Engineering
Model Generation Model Selection
Hyper parameter optimization
Model Tuning
Prediction
Data Selection
Data Cleaning
Streaming Data
Data Augmentation
Data Pre-Processing
Definition of Data Flow
Data
Cleansing
Feature
Engineering
Deep Learning이나 Machine Learning을 하기 위해선 Data를 변환 필요
Data 확보 Process Check
• Viewpoint variation(시점 변화). 객체의 단일 인스턴스는 카메라에 의해 시점이 달라질
수 있다.
• Scale variation(크기 변화). 비주얼 클래스는 대부분 그것들의 크기의 변화를
나타낸다(이미지의 크기뿐만 아니라 실제 세계에서의 크기까지 포함함).
• Deformation(변형). 많은 객체들은 고정된 형태가 없고, 극단적인 형태로 변형될 수 있다.
• Occlusion(폐색). 객체들은 전체가 보이지 않을 수 있다. 때로는 물체의 매우 적은
부분(매우 적은 픽셀)만이 보인다.
• Illumination conditions(조명 상태). 조명의 영향으로 픽셀 값이 변형된다.
• Background clutter(배경 분규류). 객체가 주변 환경에 섞여(blend) 알아보기 힘들게 된다.
• Intra-class variation(내부클래스의 다양성). 분류해야할 클래스는 범위가 큰 것들이 많다.
예를 들어 의자 의 경우, 매우 다양한 형태의 객체가 있다.
좋은 이미지 분류기는 각 클래스간의 감도를 유지하면서 동시에 이런 다양한 문제들에 대해
변함 없이 분류할 수 있는 성능을 유지해야 한다.
Data Pre-Processing (Image)
Lack of Training Data
• Deep learning은 feature learning을 포함
– 기존 domain에서 사용하던 feature engineering을
일부 대체할 수 있음
• 의료 영상에서에서 보인 성과보다 더 큰 성과를 만들
수 있음
– Signal, text에서의 feature engineering은 영상보
다 더 어려움
• EHR 데이터 증가
– 오바마케어의 핵심 정책 중 하나가 의료정보의 디지털화
– 300억 달러 투입
– 인센티브와 패털티 부여를 통해 EHR 보급 확대
– 국내에서도 EHR/EMR 정비를 통해 데이터 수집
• Deep learning은 data-driven approach
– 데이터가 쌓일수록 성능이 높아짐
EHR에서 deep learning은 주로 RNNs가 사용
– EHR 데이터는 환자마다 길이가 다름
– 환자를 진료할 때, 특정 시간만의 상태만 보는 것이
아니라 이전 상태도 함께 고려
: 주로 Recurrent Neural Networks (RNNs) 이용
• Missing rate가 높은 variable은 mortality, diagnoses와 상관관계가 높음
• Rich information
– Missing value 예측해 input에 채움
– Missing value를 정확히 예측할수록 event 예측의 정확도가 높아짐
Missing Value의 중요성 (정형)
중증 패혈증 및 패혈성 쇼크 환자에서 예측
패혈증은 감염에 따른 전신적 염증반응으로 산소공급 과 소모에 불균형이 초
래하여 저관류와 저산소증을 유발하 며, 이러한 세포의 저관류와 저산소증 상
태가 지속되면, 세 포내의 사립체 산화적 인산화(mitochondrial oxidative
phosphorylation) 과정이 적절히 이루어지지 않게 되고 결국 혐기 성 해당작용
(anaerobic glycolysis)을 통하여 세포에 필요한 에너지가 공급된다.
Data Cleansing (Null값 처리 방법)
- Delete(삭제)
. 가장 간단한 방법
. 누락된 데이터가 10%이상이 될 경우 고려가 필요
. 누락된 데이터 자체가 의미가 있을 경우 고려가 필요함
예: 설문지에서 나이가 필수가 아닌 경우 누락된 나이는 개인정보를 민감하게
반응하는 사람을 대표할 수도 있음
-Filling(채우기)
.data를 채우는 방법
.범주형(Categorical)데이터는 Unknown 혹은 특정 값으로 변환
.연속형 데이터는 0 혹은 평균 등을 사용가능
Data Pre-Processing(정형)
Feature Engineering
. Category Data 변환
. Continuous Data를 범주형으로 변환
. Feature를 더해서 새로운 Feature를 만듦
. Feature의 중요도를 찾아서 필요 없는 Feature 제거
. 연속형을 범주형 데이터로 변환
Feature Engineering을 하기 위한 필수 라이브러리
. PANDAS : 데이터를 보고 간단한 연산을 수행
. Scikit-Learn : 각종 머신러닝 모델
. Xgboost : Gradient Boosting 라이브러리
. Matplotlib : 데이터 시각화
Data Pre-Processing(정형)
Weakly Supervised Learning
+ Class Activation Map
Deep learning is Data-Driven approach
Data Building in Medical Environment
Cleansing of Clinical Data
Raw Data
연구 목적에 맞는 데이터 획득 (ChestPA X ray image)
Data 수집
Data Building in Medical Environment
Anonymization of Clinical Data
 개인정보보호법 – 환자 개인정보 보호를 위한 법규
 주민등록법 – 주민등록번호 수집 및 활용에 대한 제한
 개인정보 보호 방법
 익명화
 암호화
Data 수집
Practical Examples in Medical Environment
• Classification
- ChestPA X-ray data cleansing
• Detection & Localization
- ChestPA X-ray lesion detection
ChestPA X-ray Data Cleansing
• Classification
- Development environment
- Pre-Processing
- Network architecture
- Result
1
ChestPA X-ray Data Cleansing
Pre-processing
 ChestPA X-Ray image Read
 100 X 100 resize for network
 Low resolution : 정상보단 비정상 데이터의 variation이 더 큼
Data Cleansing
Classification
1
ChestPA X-ray Data Cleansing
Network Architecture
 Customized - VGG-16
Sigmoid layer 이전에 Batch Normalization (BN)을 추가하여 성능을
획기적으로 개선
Data Cleansing
Classification
1
batch normalization으로도 풀 수 없는 문제
서로 다른 Scale의 Data를 Normalization하여 하나의 데이터 셋을 만든다고
가정하자
Artifact를 추가하지 않기 위해서는 더 낮은 해상도의 데이터 셋으로 scale하는
것이 일반적이다.
그렇다면 기존의 데이터의 기준이 각자 다른 경우 batch normalization을 사용
한다고 하여 성능 보장을 장담할 수 있을까?
기계 학습 과정에서 데이터 정규화 과정이 끼치는 영향을 항상 고려해야 한다.
ChestPA X-ray Data Cleansing
Results
Data Cleansing
Classification
1
의료 인공 지능 사례
의료 인공 지능 적용 대상 (1)
의료 인공 지능 적용 대상 (2)
의료 인공 지능 적용 대상 (3)
데이터의 관점으로 바라본 의료 딥러닝

Weitere ähnliche Inhalte

Was ist angesagt?

디지털 헬스케어 국내 규제, 무엇이 바뀌어야 하나? (ver 0.1)
디지털 헬스케어 국내 규제, 무엇이 바뀌어야 하나? (ver 0.1)디지털 헬스케어 국내 규제, 무엇이 바뀌어야 하나? (ver 0.1)
디지털 헬스케어 국내 규제, 무엇이 바뀌어야 하나? (ver 0.1)Yoon Sup Choi
 
뉴럴웍스 이미지 인식 AI 암진단AI 대장암, 위암
뉴럴웍스 이미지 인식 AI 암진단AI 대장암, 위암뉴럴웍스 이미지 인식 AI 암진단AI 대장암, 위암
뉴럴웍스 이미지 인식 AI 암진단AI 대장암, 위암Daehee Han
 
웨어러블 컴퓨팅 환경에서의 센서 역할 및 활용방향
웨어러블 컴퓨팅 환경에서의 센서 역할 및 활용방향웨어러블 컴퓨팅 환경에서의 센서 역할 및 활용방향
웨어러블 컴퓨팅 환경에서의 센서 역할 및 활용방향atelier t*h
 
[2A6]web & health 2.0. 회사에서의 data science란?
[2A6]web & health 2.0. 회사에서의 data science란?[2A6]web & health 2.0. 회사에서의 data science란?
[2A6]web & health 2.0. 회사에서의 data science란?NAVER D2
 
U Health Platform
U Health PlatformU Health Platform
U Health PlatformKia Motors
 
Khidi+brief+vol.115
Khidi+brief+vol.115Khidi+brief+vol.115
Khidi+brief+vol.115대현 임
 

Was ist angesagt? (6)

디지털 헬스케어 국내 규제, 무엇이 바뀌어야 하나? (ver 0.1)
디지털 헬스케어 국내 규제, 무엇이 바뀌어야 하나? (ver 0.1)디지털 헬스케어 국내 규제, 무엇이 바뀌어야 하나? (ver 0.1)
디지털 헬스케어 국내 규제, 무엇이 바뀌어야 하나? (ver 0.1)
 
뉴럴웍스 이미지 인식 AI 암진단AI 대장암, 위암
뉴럴웍스 이미지 인식 AI 암진단AI 대장암, 위암뉴럴웍스 이미지 인식 AI 암진단AI 대장암, 위암
뉴럴웍스 이미지 인식 AI 암진단AI 대장암, 위암
 
웨어러블 컴퓨팅 환경에서의 센서 역할 및 활용방향
웨어러블 컴퓨팅 환경에서의 센서 역할 및 활용방향웨어러블 컴퓨팅 환경에서의 센서 역할 및 활용방향
웨어러블 컴퓨팅 환경에서의 센서 역할 및 활용방향
 
[2A6]web & health 2.0. 회사에서의 data science란?
[2A6]web & health 2.0. 회사에서의 data science란?[2A6]web & health 2.0. 회사에서의 data science란?
[2A6]web & health 2.0. 회사에서의 data science란?
 
U Health Platform
U Health PlatformU Health Platform
U Health Platform
 
Khidi+brief+vol.115
Khidi+brief+vol.115Khidi+brief+vol.115
Khidi+brief+vol.115
 

Ähnlich wie 데이터의 관점으로 바라본 의료 딥러닝

Radiomics: Novel Paradigm of Deep Learning for Clinical Decision Support towa...
Radiomics: Novel Paradigm of Deep Learning for Clinical Decision Support towa...Radiomics: Novel Paradigm of Deep Learning for Clinical Decision Support towa...
Radiomics: Novel Paradigm of Deep Learning for Clinical Decision Support towa...Wookjin Choi
 
국내 의료기기 인터페이스 관련의료기관 정보현황의 이해 - 이제관 기술사 -
국내 의료기기 인터페이스 관련의료기관 정보현황의 이해 - 이제관 기술사 -국내 의료기기 인터페이스 관련의료기관 정보현황의 이해 - 이제관 기술사 -
국내 의료기기 인터페이스 관련의료기관 정보현황의 이해 - 이제관 기술사 -제관 이
 
빅데이터전문가교육 2학기
빅데이터전문가교육 2학기빅데이터전문가교육 2학기
빅데이터전문가교육 2학기Kangwook Lee
 
헬스케어 웨어러블 디바이스 적용기술 및 서비스 사례와 주요과제
헬스케어 웨어러블 디바이스 적용기술 및 서비스 사례와 주요과제 헬스케어 웨어러블 디바이스 적용기술 및 서비스 사례와 주요과제
헬스케어 웨어러블 디바이스 적용기술 및 서비스 사례와 주요과제 제관 이
 
의료사업 선진화를 위한 빅데이터 분석 - 서울아산병원 심우현 교수
의료사업 선진화를 위한 빅데이터 분석 - 서울아산병원 심우현 교수의료사업 선진화를 위한 빅데이터 분석 - 서울아산병원 심우현 교수
의료사업 선진화를 위한 빅데이터 분석 - 서울아산병원 심우현 교수eungjin cho
 
4차산업혁명시대의 의과학교육
4차산업혁명시대의 의과학교육4차산업혁명시대의 의과학교육
4차산업혁명시대의 의과학교육Namkug Kim
 
디지털 트윈과 핼스케어 Digital Twin and Healthcare
디지털 트윈과 핼스케어  Digital Twin and Healthcare디지털 트윈과 핼스케어  Digital Twin and Healthcare
디지털 트윈과 핼스케어 Digital Twin and HealthcareJahee Lee
 
빅데이터의 이해
빅데이터의 이해빅데이터의 이해
빅데이터의 이해수보 김
 
Bioinformatics tool & database 20130722 이승배
Bioinformatics tool & database 20130722 이승배Bioinformatics tool & database 20130722 이승배
Bioinformatics tool & database 20130722 이승배SEUNG BAE LEE
 
Src슬라이드(3총괄2세부) 김유경
Src슬라이드(3총괄2세부) 김유경Src슬라이드(3총괄2세부) 김유경
Src슬라이드(3총괄2세부) 김유경SRCDSC
 
빅데이터의 활용
빅데이터의 활용빅데이터의 활용
빅데이터의 활용수보 김
 
Animal science with data science
Animal science with data scienceAnimal science with data science
Animal science with data scienceYoungjun Na
 
RAD스튜디오를 활용한 헬스 케어 시스템 구축방안
RAD스튜디오를 활용한 헬스 케어 시스템 구축방안 RAD스튜디오를 활용한 헬스 케어 시스템 구축방안
RAD스튜디오를 활용한 헬스 케어 시스템 구축방안 Devgear
 
데이터과학의 정의와 대표과제 도출
데이터과학의 정의와 대표과제 도출데이터과학의 정의와 대표과제 도출
데이터과학의 정의와 대표과제 도출SRCDSC
 
[2016 데이터 그랜드 컨퍼런스] 6 4(전략,솔루션). 신테카바이오 insilico-임상연구동향
[2016 데이터 그랜드 컨퍼런스] 6 4(전략,솔루션). 신테카바이오 insilico-임상연구동향[2016 데이터 그랜드 컨퍼런스] 6 4(전략,솔루션). 신테카바이오 insilico-임상연구동향
[2016 데이터 그랜드 컨퍼런스] 6 4(전략,솔루션). 신테카바이오 insilico-임상연구동향K data
 
건강정보 전달과 IT 정희두(헬스웨이브 대표)
 건강정보 전달과 IT 정희두(헬스웨이브 대표) 건강정보 전달과 IT 정희두(헬스웨이브 대표)
건강정보 전달과 IT 정희두(헬스웨이브 대표)mothersafe
 
Ankus 제품소개서
Ankus 제품소개서Ankus 제품소개서
Ankus 제품소개서onycom1
 
4차산업시대와 의료환경
4차산업시대와 의료환경 4차산업시대와 의료환경
4차산업시대와 의료환경 Namkug Kim
 
융합연구포럼 2015.02 big data - engineering & convergence.
융합연구포럼 2015.02 big data - engineering & convergence.융합연구포럼 2015.02 big data - engineering & convergence.
융합연구포럼 2015.02 big data - engineering & convergence.Chanjin Park
 
2010 0603 이상호_과학데이터 아카이빙-이상호
2010 0603 이상호_과학데이터 아카이빙-이상호2010 0603 이상호_과학데이터 아카이빙-이상호
2010 0603 이상호_과학데이터 아카이빙-이상호glorykim
 

Ähnlich wie 데이터의 관점으로 바라본 의료 딥러닝 (20)

Radiomics: Novel Paradigm of Deep Learning for Clinical Decision Support towa...
Radiomics: Novel Paradigm of Deep Learning for Clinical Decision Support towa...Radiomics: Novel Paradigm of Deep Learning for Clinical Decision Support towa...
Radiomics: Novel Paradigm of Deep Learning for Clinical Decision Support towa...
 
국내 의료기기 인터페이스 관련의료기관 정보현황의 이해 - 이제관 기술사 -
국내 의료기기 인터페이스 관련의료기관 정보현황의 이해 - 이제관 기술사 -국내 의료기기 인터페이스 관련의료기관 정보현황의 이해 - 이제관 기술사 -
국내 의료기기 인터페이스 관련의료기관 정보현황의 이해 - 이제관 기술사 -
 
빅데이터전문가교육 2학기
빅데이터전문가교육 2학기빅데이터전문가교육 2학기
빅데이터전문가교육 2학기
 
헬스케어 웨어러블 디바이스 적용기술 및 서비스 사례와 주요과제
헬스케어 웨어러블 디바이스 적용기술 및 서비스 사례와 주요과제 헬스케어 웨어러블 디바이스 적용기술 및 서비스 사례와 주요과제
헬스케어 웨어러블 디바이스 적용기술 및 서비스 사례와 주요과제
 
의료사업 선진화를 위한 빅데이터 분석 - 서울아산병원 심우현 교수
의료사업 선진화를 위한 빅데이터 분석 - 서울아산병원 심우현 교수의료사업 선진화를 위한 빅데이터 분석 - 서울아산병원 심우현 교수
의료사업 선진화를 위한 빅데이터 분석 - 서울아산병원 심우현 교수
 
4차산업혁명시대의 의과학교육
4차산업혁명시대의 의과학교육4차산업혁명시대의 의과학교육
4차산업혁명시대의 의과학교육
 
디지털 트윈과 핼스케어 Digital Twin and Healthcare
디지털 트윈과 핼스케어  Digital Twin and Healthcare디지털 트윈과 핼스케어  Digital Twin and Healthcare
디지털 트윈과 핼스케어 Digital Twin and Healthcare
 
빅데이터의 이해
빅데이터의 이해빅데이터의 이해
빅데이터의 이해
 
Bioinformatics tool & database 20130722 이승배
Bioinformatics tool & database 20130722 이승배Bioinformatics tool & database 20130722 이승배
Bioinformatics tool & database 20130722 이승배
 
Src슬라이드(3총괄2세부) 김유경
Src슬라이드(3총괄2세부) 김유경Src슬라이드(3총괄2세부) 김유경
Src슬라이드(3총괄2세부) 김유경
 
빅데이터의 활용
빅데이터의 활용빅데이터의 활용
빅데이터의 활용
 
Animal science with data science
Animal science with data scienceAnimal science with data science
Animal science with data science
 
RAD스튜디오를 활용한 헬스 케어 시스템 구축방안
RAD스튜디오를 활용한 헬스 케어 시스템 구축방안 RAD스튜디오를 활용한 헬스 케어 시스템 구축방안
RAD스튜디오를 활용한 헬스 케어 시스템 구축방안
 
데이터과학의 정의와 대표과제 도출
데이터과학의 정의와 대표과제 도출데이터과학의 정의와 대표과제 도출
데이터과학의 정의와 대표과제 도출
 
[2016 데이터 그랜드 컨퍼런스] 6 4(전략,솔루션). 신테카바이오 insilico-임상연구동향
[2016 데이터 그랜드 컨퍼런스] 6 4(전략,솔루션). 신테카바이오 insilico-임상연구동향[2016 데이터 그랜드 컨퍼런스] 6 4(전략,솔루션). 신테카바이오 insilico-임상연구동향
[2016 데이터 그랜드 컨퍼런스] 6 4(전략,솔루션). 신테카바이오 insilico-임상연구동향
 
건강정보 전달과 IT 정희두(헬스웨이브 대표)
 건강정보 전달과 IT 정희두(헬스웨이브 대표) 건강정보 전달과 IT 정희두(헬스웨이브 대표)
건강정보 전달과 IT 정희두(헬스웨이브 대표)
 
Ankus 제품소개서
Ankus 제품소개서Ankus 제품소개서
Ankus 제품소개서
 
4차산업시대와 의료환경
4차산업시대와 의료환경 4차산업시대와 의료환경
4차산업시대와 의료환경
 
융합연구포럼 2015.02 big data - engineering & convergence.
융합연구포럼 2015.02 big data - engineering & convergence.융합연구포럼 2015.02 big data - engineering & convergence.
융합연구포럼 2015.02 big data - engineering & convergence.
 
2010 0603 이상호_과학데이터 아카이빙-이상호
2010 0603 이상호_과학데이터 아카이빙-이상호2010 0603 이상호_과학데이터 아카이빙-이상호
2010 0603 이상호_과학데이터 아카이빙-이상호
 

Mehr von Tae Young Lee

A future that integrates LLMs and LAMs (Symposium)
A future that integrates LLMs and LAMs (Symposium)A future that integrates LLMs and LAMs (Symposium)
A future that integrates LLMs and LAMs (Symposium)Tae Young Lee
 
LLMs Service that provides what users want to know
LLMs Service that provides what users want to knowLLMs Service that provides what users want to know
LLMs Service that provides what users want to knowTae Young Lee
 
Exploring Deep Learning Acceleration Technology Embedded in LLMs
Exploring Deep Learning Acceleration Technology Embedded in LLMsExploring Deep Learning Acceleration Technology Embedded in LLMs
Exploring Deep Learning Acceleration Technology Embedded in LLMsTae Young Lee
 
LLM 모델 기반 서비스 실전 가이드
LLM 모델 기반 서비스 실전 가이드LLM 모델 기반 서비스 실전 가이드
LLM 모델 기반 서비스 실전 가이드Tae Young Lee
 
Recommendation System History
Recommendation System HistoryRecommendation System History
Recommendation System HistoryTae Young Lee
 
검색엔진에 적용된 ChatGPT
검색엔진에 적용된 ChatGPT검색엔진에 적용된 ChatGPT
검색엔진에 적용된 ChatGPTTae Young Lee
 
검색엔진에 적용된 딥러닝 모델 방법론
검색엔진에 적용된 딥러닝 모델 방법론검색엔진에 적용된 딥러닝 모델 방법론
검색엔진에 적용된 딥러닝 모델 방법론Tae Young Lee
 
The Deep Learning Compiler
The Deep Learning CompilerThe Deep Learning Compiler
The Deep Learning CompilerTae Young Lee
 
History of Vision AI
History of Vision AIHistory of Vision AI
History of Vision AITae Young Lee
 
Enhanced ai platform
Enhanced ai platformEnhanced ai platform
Enhanced ai platformTae Young Lee
 
Real estate trust solution
Real estate trust solutionReal estate trust solution
Real estate trust solutionTae Young Lee
 
Transfer learning usage
Transfer learning usageTransfer learning usage
Transfer learning usageTae Young Lee
 
Create a solution including deep learning models
Create a solution including deep learning modelsCreate a solution including deep learning models
Create a solution including deep learning modelsTae Young Lee
 
Infra as a model service
Infra as a model serviceInfra as a model service
Infra as a model serviceTae Young Lee
 
Deep learning financial product recommendation model
Deep learning financial product recommendation modelDeep learning financial product recommendation model
Deep learning financial product recommendation modelTae Young Lee
 

Mehr von Tae Young Lee (20)

A future that integrates LLMs and LAMs (Symposium)
A future that integrates LLMs and LAMs (Symposium)A future that integrates LLMs and LAMs (Symposium)
A future that integrates LLMs and LAMs (Symposium)
 
LLMs Service that provides what users want to know
LLMs Service that provides what users want to knowLLMs Service that provides what users want to know
LLMs Service that provides what users want to know
 
Exploring Deep Learning Acceleration Technology Embedded in LLMs
Exploring Deep Learning Acceleration Technology Embedded in LLMsExploring Deep Learning Acceleration Technology Embedded in LLMs
Exploring Deep Learning Acceleration Technology Embedded in LLMs
 
LLM 모델 기반 서비스 실전 가이드
LLM 모델 기반 서비스 실전 가이드LLM 모델 기반 서비스 실전 가이드
LLM 모델 기반 서비스 실전 가이드
 
Recommendation System History
Recommendation System HistoryRecommendation System History
Recommendation System History
 
검색엔진에 적용된 ChatGPT
검색엔진에 적용된 ChatGPT검색엔진에 적용된 ChatGPT
검색엔진에 적용된 ChatGPT
 
검색엔진에 적용된 딥러닝 모델 방법론
검색엔진에 적용된 딥러닝 모델 방법론검색엔진에 적용된 딥러닝 모델 방법론
검색엔진에 적용된 딥러닝 모델 방법론
 
PaLM Paper Review
PaLM Paper ReviewPaLM Paper Review
PaLM Paper Review
 
The Deep Learning Compiler
The Deep Learning CompilerThe Deep Learning Compiler
The Deep Learning Compiler
 
History of Vision AI
History of Vision AIHistory of Vision AI
History of Vision AI
 
Aws architecture
Aws architectureAws architecture
Aws architecture
 
Enhanced ai platform
Enhanced ai platformEnhanced ai platform
Enhanced ai platform
 
Nvidia architecture
Nvidia architectureNvidia architecture
Nvidia architecture
 
Ai based on gpu
Ai based on gpuAi based on gpu
Ai based on gpu
 
Real estate trust solution
Real estate trust solutionReal estate trust solution
Real estate trust solution
 
Transfer learning usage
Transfer learning usageTransfer learning usage
Transfer learning usage
 
Create a solution including deep learning models
Create a solution including deep learning modelsCreate a solution including deep learning models
Create a solution including deep learning models
 
Infra as a model service
Infra as a model serviceInfra as a model service
Infra as a model service
 
Bayesian learning
Bayesian learningBayesian learning
Bayesian learning
 
Deep learning financial product recommendation model
Deep learning financial product recommendation modelDeep learning financial product recommendation model
Deep learning financial product recommendation model
 

데이터의 관점으로 바라본 의료 딥러닝

  • 1. Medical Deep Learning through data-driven Produced By Tae Young Lee
  • 2. 2014 2015 20172016 [제88회 Open Technet] 오픈소스 딥러닝 프레임워크 제작하기 [SK Planet] TensorFlow 기본 AutoML & AutoD raw [SK T academy] 딥러닝을 위한 TensorFlow Sequence Model and the RNN API Machine Learning In SPAM Python Network Programming Neural Network의 변천사를 통해 바라 본 R에서 Deep Ne ural Net활용 Change the world in IOT (Falinux) Game based on t he IOT (KGC)
  • 4.
  • 7. 이집트에서 가장 오래된 묘사는 기원전 3000 년경으로 거슬러 올라갑니다. 그것은 에드윈 스미스 파피루스 (Edwin Smith Papyrus)라고 불리우며 외상 수술에 관한 고대 이집트 교과서의 사본입니다. Fire Drill이라고 불리는 도구를 사용하여 소작 술 한 8 개의 종양이나 유방 궤양에 대해 설명함 Hippocrates (460-370 처음으로 불렸습니 다 암에게. 그는 여겨집니다 Hippocrates는 기간 carcinos 및 비 궤양 형성 및 궤양 형 성 종양을 기술하기 위하여 암을 이용했습 니다. 그리스어에서 이것은 crab을 의미 19 세기 Rudolf Virchow는 종종 세포 병리학의 창시자라고 불리며, 현미경으로 암의 병 리학 적 연구를위한 기초를 마련했습니 다. Virchow는 병에 현미경 병리를 연관 시켰다. 1860 년대에 독일의 외과의사인 Karl Thiersch는 암은 액체가 아닌 악성 세포 의 전이를 통해 전이한다는 것을 보여주 었습니다. 암 검진은 조기 발견에 도움이됩니다. 암 으로 널리 사용되는 첫 번째 선별 검사는 팹 테스트 (Pap test)였습니다. 그것은 생 리주기를 이해하는 연구 방법으로 George Papanicolaou가 개발했습니다. 그는이 검사가 자궁 경부암을 조기 발견 하는 데 도움이 될 수 있으며 1923 년에 발견 한 사실을 지적했다. 스코틀랜드의 외과 의사 John Hunter (1728-1793)는 수술로 일부 암이 완치 될 수 있다고 제안했습니다. 마취의 발달로 다른 장기로 전이되지 않 은 "움직일 수있는"암에 대한 정기적 인 수술이 시작된 것은 거의 1 세기 후였다. 진단
  • 9. 의료연구 기간계 : OCS (Order Communication System) EMR(Electronic Medical Record), PACS - 전자차트 정보계 : DW, OLAP, CDSS(Clinical Decision Support System) 연 계 : DUR(의약품안전정보), NEDIS(응급환자진료정보망)
  • 10. 의료기기 목적하는 부위를 선택하고 나머지는 제거한다 이중 염색 인화지에 복사된 그림으로 정보 획득 환자별로 파일 정리 PACS (Picture Archiving & Communication System) •ACQ (획득서버) •HIS (연계서버) •WEB (웹서버) •GATEWAY (연동장치) •VIEWER (뷰어) •STORAGE (저장장치)
  • 11. 의료기술 CVR (Critical Value Report) EHR (Electrical Health Record)
  • 12. Human Metabolism(物質代謝) 물질대사 : 생물체 내의 화학반응 ( 물질합성/분해 for E출입)
  • 13. Deep Learning Many Data All of them 변하는 요인들을 예측하기 위해 가장 필요한 것은
  • 16.
  • 17.
  • 18. 인공 지능을 활용하여 의료 영상 판독의 정확도를 높일 수 있음
  • 20. The Perspective of Data Flow Data Selection Data CleaningStreaming Data Data Augmentation Data Pre-Processing Feature Engineering Model Generation Model Selection Hyper parameter optimization Model Tuning Prediction
  • 21. Data Selection Data Cleaning Streaming Data Data Augmentation Data Pre-Processing Definition of Data Flow
  • 22. Data Cleansing Feature Engineering Deep Learning이나 Machine Learning을 하기 위해선 Data를 변환 필요 Data 확보 Process Check
  • 23. • Viewpoint variation(시점 변화). 객체의 단일 인스턴스는 카메라에 의해 시점이 달라질 수 있다. • Scale variation(크기 변화). 비주얼 클래스는 대부분 그것들의 크기의 변화를 나타낸다(이미지의 크기뿐만 아니라 실제 세계에서의 크기까지 포함함). • Deformation(변형). 많은 객체들은 고정된 형태가 없고, 극단적인 형태로 변형될 수 있다. • Occlusion(폐색). 객체들은 전체가 보이지 않을 수 있다. 때로는 물체의 매우 적은 부분(매우 적은 픽셀)만이 보인다. • Illumination conditions(조명 상태). 조명의 영향으로 픽셀 값이 변형된다. • Background clutter(배경 분규류). 객체가 주변 환경에 섞여(blend) 알아보기 힘들게 된다. • Intra-class variation(내부클래스의 다양성). 분류해야할 클래스는 범위가 큰 것들이 많다. 예를 들어 의자 의 경우, 매우 다양한 형태의 객체가 있다. 좋은 이미지 분류기는 각 클래스간의 감도를 유지하면서 동시에 이런 다양한 문제들에 대해 변함 없이 분류할 수 있는 성능을 유지해야 한다. Data Pre-Processing (Image)
  • 24. Lack of Training Data • Deep learning은 feature learning을 포함 – 기존 domain에서 사용하던 feature engineering을 일부 대체할 수 있음 • 의료 영상에서에서 보인 성과보다 더 큰 성과를 만들 수 있음 – Signal, text에서의 feature engineering은 영상보 다 더 어려움 • EHR 데이터 증가 – 오바마케어의 핵심 정책 중 하나가 의료정보의 디지털화 – 300억 달러 투입 – 인센티브와 패털티 부여를 통해 EHR 보급 확대 – 국내에서도 EHR/EMR 정비를 통해 데이터 수집 • Deep learning은 data-driven approach – 데이터가 쌓일수록 성능이 높아짐 EHR에서 deep learning은 주로 RNNs가 사용 – EHR 데이터는 환자마다 길이가 다름 – 환자를 진료할 때, 특정 시간만의 상태만 보는 것이 아니라 이전 상태도 함께 고려 : 주로 Recurrent Neural Networks (RNNs) 이용
  • 25. • Missing rate가 높은 variable은 mortality, diagnoses와 상관관계가 높음 • Rich information – Missing value 예측해 input에 채움 – Missing value를 정확히 예측할수록 event 예측의 정확도가 높아짐 Missing Value의 중요성 (정형) 중증 패혈증 및 패혈성 쇼크 환자에서 예측 패혈증은 감염에 따른 전신적 염증반응으로 산소공급 과 소모에 불균형이 초 래하여 저관류와 저산소증을 유발하 며, 이러한 세포의 저관류와 저산소증 상 태가 지속되면, 세 포내의 사립체 산화적 인산화(mitochondrial oxidative phosphorylation) 과정이 적절히 이루어지지 않게 되고 결국 혐기 성 해당작용 (anaerobic glycolysis)을 통하여 세포에 필요한 에너지가 공급된다.
  • 26. Data Cleansing (Null값 처리 방법) - Delete(삭제) . 가장 간단한 방법 . 누락된 데이터가 10%이상이 될 경우 고려가 필요 . 누락된 데이터 자체가 의미가 있을 경우 고려가 필요함 예: 설문지에서 나이가 필수가 아닌 경우 누락된 나이는 개인정보를 민감하게 반응하는 사람을 대표할 수도 있음 -Filling(채우기) .data를 채우는 방법 .범주형(Categorical)데이터는 Unknown 혹은 특정 값으로 변환 .연속형 데이터는 0 혹은 평균 등을 사용가능 Data Pre-Processing(정형)
  • 27. Feature Engineering . Category Data 변환 . Continuous Data를 범주형으로 변환 . Feature를 더해서 새로운 Feature를 만듦 . Feature의 중요도를 찾아서 필요 없는 Feature 제거 . 연속형을 범주형 데이터로 변환 Feature Engineering을 하기 위한 필수 라이브러리 . PANDAS : 데이터를 보고 간단한 연산을 수행 . Scikit-Learn : 각종 머신러닝 모델 . Xgboost : Gradient Boosting 라이브러리 . Matplotlib : 데이터 시각화 Data Pre-Processing(정형)
  • 28. Weakly Supervised Learning + Class Activation Map
  • 29. Deep learning is Data-Driven approach
  • 30. Data Building in Medical Environment Cleansing of Clinical Data Raw Data 연구 목적에 맞는 데이터 획득 (ChestPA X ray image) Data 수집
  • 31. Data Building in Medical Environment Anonymization of Clinical Data  개인정보보호법 – 환자 개인정보 보호를 위한 법규  주민등록법 – 주민등록번호 수집 및 활용에 대한 제한  개인정보 보호 방법  익명화  암호화 Data 수집
  • 32. Practical Examples in Medical Environment • Classification - ChestPA X-ray data cleansing • Detection & Localization - ChestPA X-ray lesion detection ChestPA X-ray Data Cleansing • Classification - Development environment - Pre-Processing - Network architecture - Result 1
  • 33. ChestPA X-ray Data Cleansing Pre-processing  ChestPA X-Ray image Read  100 X 100 resize for network  Low resolution : 정상보단 비정상 데이터의 variation이 더 큼 Data Cleansing Classification 1
  • 34. ChestPA X-ray Data Cleansing Network Architecture  Customized - VGG-16 Sigmoid layer 이전에 Batch Normalization (BN)을 추가하여 성능을 획기적으로 개선 Data Cleansing Classification 1
  • 35. batch normalization으로도 풀 수 없는 문제 서로 다른 Scale의 Data를 Normalization하여 하나의 데이터 셋을 만든다고 가정하자 Artifact를 추가하지 않기 위해서는 더 낮은 해상도의 데이터 셋으로 scale하는 것이 일반적이다. 그렇다면 기존의 데이터의 기준이 각자 다른 경우 batch normalization을 사용 한다고 하여 성능 보장을 장담할 수 있을까? 기계 학습 과정에서 데이터 정규화 과정이 끼치는 영향을 항상 고려해야 한다.
  • 36. ChestPA X-ray Data Cleansing Results Data Cleansing Classification 1
  • 38. 의료 인공 지능 적용 대상 (1)
  • 39. 의료 인공 지능 적용 대상 (2)
  • 40. 의료 인공 지능 적용 대상 (3)