SlideShare ist ein Scribd-Unternehmen logo
1 von 12
Downloaden Sie, um offline zu lesen
국민건강보험 데이터 탐색적 분석
1. 분석동기 및 데이터 설명
대용량 데이터를 핸들링하는 스킬과 분석 이전 단계에서 자료를 탐색
적으로 살펴보아 분석 방향 설정과 전처리 과정에서 직관을 얻기 위하
여 실시하였다. 또한, 방대한 국민건강보험 데이터에 대한 이해를 도
와 현재의 국민건강보험의 대한 정보를 제공하는 데 목적이 있다.
1. 분석동기
국민건강보험 데이터는 국민건강보험 공공데이터 개방서비스에서
제공되고 있다. 개인식별정보는 제외되었으며 표번은 매년 100만명
의 무작위추출(Random Sampling)되었다. 자료는 매년 12월 2년 전
데이터를 추가하는 방식으로 직전년도 데이터는 추가되지 않는다.
여기서는 가장 최근 자료인 2015년도 데이터를 분석한다. 또한 ‘진
료내역 정보’와 ‘건강검진정보’를 주로 활용하였다.
2. 데이터 설명
2. 데이터 전처리
데이터셋에서 제공하는 체중과 신장을 통해 BMI 지수를 산출했다.
이는 검진정보와 민감하게 연결되어 있을 자료라 판단했기 때문이다.
1. BMI지수 산출
2. 데이터 전처리
‘건강검진정보’ 데이터에서는 제공하는 진료분류기호는 매우
세분화되어 있어 이를 대분류 기준으로 변환하였다.
2. 질병코드 차원축소
3. 탐색적 데이터 분석
3. 탐색적 데이터 분석
3. 탐색적 데이터 분석
3. 탐색적 데이터 분석
3. 탐색적 데이터 분석
3. 탐색적 데이터 분석
3. 탐색적 데이터 분석
4. 결론
- ‘진료내역 정보’와 ‘건강검진정보’를 살펴본 결과 국민건강보험은 공공부
조로의 역할을 수행한다는 사실을 확인할 수 있었다. 이는 사회적 약자인
영유아와 임산부 그리고 노년계층에게 쉽게 발생할 수 있는 질병에 대한
보장률이 높다는 데서 확인할 수 있었다.
- 또한, ‘진료내역정보’를 통하여 성별과 연령별로 쉽게 발생할 수 있는 질
병을 파악할 수 있었다.
- 종합적으로 살펴보면 현재 급격하게 진행되어가고 있는 노령화에 국민건
강보험이 대처하기 위해서는 부과방식(PAYG)보다는 적립방식으로 그 무게
를 더 옮겨야 한다고 생각한다.

Weitere ähnliche Inhalte

Was ist angesagt?

The Role of Data Governance in a Data Strategy
The Role of Data Governance in a Data StrategyThe Role of Data Governance in a Data Strategy
The Role of Data Governance in a Data StrategyDATAVERSITY
 
Data Governance and Metadata Management
Data Governance and Metadata ManagementData Governance and Metadata Management
Data Governance and Metadata Management DATAVERSITY
 
[Cloud OnAir] BigQuery ML と AutoML Tables で はじめるマーケティング分析入門 2019年5月23日 放送
[Cloud OnAir] BigQuery ML と AutoML Tables で はじめるマーケティング分析入門 2019年5月23日 放送[Cloud OnAir] BigQuery ML と AutoML Tables で はじめるマーケティング分析入門 2019年5月23日 放送
[Cloud OnAir] BigQuery ML と AutoML Tables で はじめるマーケティング分析入門 2019年5月23日 放送Google Cloud Platform - Japan
 
RWDG: Measuring Data Governance Performance
RWDG: Measuring Data Governance PerformanceRWDG: Measuring Data Governance Performance
RWDG: Measuring Data Governance PerformanceDATAVERSITY
 
Power Query Online
Power Query OnlinePower Query Online
Power Query OnlineRyoma Nagata
 
データ可視化の研究って何をしているの︖何の役に立つ︖ #yjbonfire
データ可視化の研究って何をしているの︖何の役に立つ︖ #yjbonfireデータ可視化の研究って何をしているの︖何の役に立つ︖ #yjbonfire
データ可視化の研究って何をしているの︖何の役に立つ︖ #yjbonfireYahoo!デベロッパーネットワーク
 
今だから知りたい BigQuery 再入門 | Google Cloud INSIDE Games & Apps: Online
今だから知りたい BigQuery 再入門 | Google Cloud INSIDE Games & Apps: Online今だから知りたい BigQuery 再入門 | Google Cloud INSIDE Games & Apps: Online
今だから知りたい BigQuery 再入門 | Google Cloud INSIDE Games & Apps: OnlineGoogle Cloud Platform - Japan
 
Data-Ed Webinar: Data Quality Success Stories
Data-Ed Webinar: Data Quality Success StoriesData-Ed Webinar: Data Quality Success Stories
Data-Ed Webinar: Data Quality Success StoriesDATAVERSITY
 
pythonでemlファイルを扱う話
pythonでemlファイルを扱う話pythonでemlファイルを扱う話
pythonでemlファイルを扱う話Satoshi Yamada
 
なぜ、CData Softwareが Power BI 専用 コネクターを 開発したのか?
なぜ、CData Softwareが Power BI 専用 コネクターを 開発したのか?なぜ、CData Softwareが Power BI 専用 コネクターを 開発したのか?
なぜ、CData Softwareが Power BI 専用 コネクターを 開発したのか?CData Software Japan
 
Data Observability.pptx
Data Observability.pptxData Observability.pptx
Data Observability.pptxSonaSamad1
 
リクルートにおけるデータのインフラ化への取組
リクルートにおけるデータのインフラ化への取組リクルートにおけるデータのインフラ化への取組
リクルートにおけるデータのインフラ化への取組Recruit Technologies
 
Tableau Serverを利用した組織レベルでのデータ分析
Tableau Serverを利用した組織レベルでのデータ分析 Tableau Serverを利用した組織レベルでのデータ分析
Tableau Serverを利用した組織レベルでのデータ分析 Hortonworks Japan
 
機械学習と機械発見:自然科学研究におけるデータ利活用の再考
機械学習と機械発見:自然科学研究におけるデータ利活用の再考機械学習と機械発見:自然科学研究におけるデータ利活用の再考
機械学習と機械発見:自然科学研究におけるデータ利活用の再考Ichigaku Takigawa
 
You Need a Data Catalog. Do You Know Why?
You Need a Data Catalog. Do You Know Why?You Need a Data Catalog. Do You Know Why?
You Need a Data Catalog. Do You Know Why?Precisely
 
Supply Chain Twin Demo - Companion Deck
Supply Chain Twin Demo - Companion DeckSupply Chain Twin Demo - Companion Deck
Supply Chain Twin Demo - Companion DeckNeo4j
 
How to Make a Data Governance Program that Lasts
How to Make a Data Governance Program that LastsHow to Make a Data Governance Program that Lasts
How to Make a Data Governance Program that LastsDATAVERSITY
 
データベース02 - SQL概要
データベース02 - SQL概要データベース02 - SQL概要
データベース02 - SQL概要Kenta Oku
 

Was ist angesagt? (20)

The Role of Data Governance in a Data Strategy
The Role of Data Governance in a Data StrategyThe Role of Data Governance in a Data Strategy
The Role of Data Governance in a Data Strategy
 
Data modeling for the business
Data modeling for the businessData modeling for the business
Data modeling for the business
 
Data Governance and Metadata Management
Data Governance and Metadata ManagementData Governance and Metadata Management
Data Governance and Metadata Management
 
[Cloud OnAir] BigQuery ML と AutoML Tables で はじめるマーケティング分析入門 2019年5月23日 放送
[Cloud OnAir] BigQuery ML と AutoML Tables で はじめるマーケティング分析入門 2019年5月23日 放送[Cloud OnAir] BigQuery ML と AutoML Tables で はじめるマーケティング分析入門 2019年5月23日 放送
[Cloud OnAir] BigQuery ML と AutoML Tables で はじめるマーケティング分析入門 2019年5月23日 放送
 
RWDG: Measuring Data Governance Performance
RWDG: Measuring Data Governance PerformanceRWDG: Measuring Data Governance Performance
RWDG: Measuring Data Governance Performance
 
Power Query Online
Power Query OnlinePower Query Online
Power Query Online
 
Big Data Fundamentals
Big Data FundamentalsBig Data Fundamentals
Big Data Fundamentals
 
データ可視化の研究って何をしているの︖何の役に立つ︖ #yjbonfire
データ可視化の研究って何をしているの︖何の役に立つ︖ #yjbonfireデータ可視化の研究って何をしているの︖何の役に立つ︖ #yjbonfire
データ可視化の研究って何をしているの︖何の役に立つ︖ #yjbonfire
 
今だから知りたい BigQuery 再入門 | Google Cloud INSIDE Games & Apps: Online
今だから知りたい BigQuery 再入門 | Google Cloud INSIDE Games & Apps: Online今だから知りたい BigQuery 再入門 | Google Cloud INSIDE Games & Apps: Online
今だから知りたい BigQuery 再入門 | Google Cloud INSIDE Games & Apps: Online
 
Data-Ed Webinar: Data Quality Success Stories
Data-Ed Webinar: Data Quality Success StoriesData-Ed Webinar: Data Quality Success Stories
Data-Ed Webinar: Data Quality Success Stories
 
pythonでemlファイルを扱う話
pythonでemlファイルを扱う話pythonでemlファイルを扱う話
pythonでemlファイルを扱う話
 
なぜ、CData Softwareが Power BI 専用 コネクターを 開発したのか?
なぜ、CData Softwareが Power BI 専用 コネクターを 開発したのか?なぜ、CData Softwareが Power BI 専用 コネクターを 開発したのか?
なぜ、CData Softwareが Power BI 専用 コネクターを 開発したのか?
 
Data Observability.pptx
Data Observability.pptxData Observability.pptx
Data Observability.pptx
 
リクルートにおけるデータのインフラ化への取組
リクルートにおけるデータのインフラ化への取組リクルートにおけるデータのインフラ化への取組
リクルートにおけるデータのインフラ化への取組
 
Tableau Serverを利用した組織レベルでのデータ分析
Tableau Serverを利用した組織レベルでのデータ分析 Tableau Serverを利用した組織レベルでのデータ分析
Tableau Serverを利用した組織レベルでのデータ分析
 
機械学習と機械発見:自然科学研究におけるデータ利活用の再考
機械学習と機械発見:自然科学研究におけるデータ利活用の再考機械学習と機械発見:自然科学研究におけるデータ利活用の再考
機械学習と機械発見:自然科学研究におけるデータ利活用の再考
 
You Need a Data Catalog. Do You Know Why?
You Need a Data Catalog. Do You Know Why?You Need a Data Catalog. Do You Know Why?
You Need a Data Catalog. Do You Know Why?
 
Supply Chain Twin Demo - Companion Deck
Supply Chain Twin Demo - Companion DeckSupply Chain Twin Demo - Companion Deck
Supply Chain Twin Demo - Companion Deck
 
How to Make a Data Governance Program that Lasts
How to Make a Data Governance Program that LastsHow to Make a Data Governance Program that Lasts
How to Make a Data Governance Program that Lasts
 
データベース02 - SQL概要
データベース02 - SQL概要データベース02 - SQL概要
データベース02 - SQL概要
 

Ähnlich wie 탐색적 데이터분석(국민건강보험)

헬스케어 빅데이터 동향
헬스케어 빅데이터 동향헬스케어 빅데이터 동향
헬스케어 빅데이터 동향Soo-Yong Shin
 
Quantified-Patient: 데이터가 매개하는 환자-의사 커뮤니케이션
Quantified-Patient: 데이터가 매개하는 환자-의사 커뮤니케이션Quantified-Patient: 데이터가 매개하는 환자-의사 커뮤니케이션
Quantified-Patient: 데이터가 매개하는 환자-의사 커뮤니케이션Myuserable
 
국내외 보건의료 빅데이터 현황 및 과제
국내외 보건의료 빅데이터 현황 및 과제국내외 보건의료 빅데이터 현황 및 과제
국내외 보건의료 빅데이터 현황 및 과제atelier t*h
 
병원 의료 및 제약 Bigdata 활용 마케팅전략
병원 의료 및 제약 Bigdata 활용 마케팅전략병원 의료 및 제약 Bigdata 활용 마케팅전략
병원 의료 및 제약 Bigdata 활용 마케팅전략Digital Initiative Group
 
의료사업 선진화를 위한 빅데이터 분석 - 서울아산병원 심우현 교수
의료사업 선진화를 위한 빅데이터 분석 - 서울아산병원 심우현 교수의료사업 선진화를 위한 빅데이터 분석 - 서울아산병원 심우현 교수
의료사업 선진화를 위한 빅데이터 분석 - 서울아산병원 심우현 교수eungjin cho
 
Know Your Patient through Data!
Know Your Patient through Data!Know Your Patient through Data!
Know Your Patient through Data!Yoojung Kim
 
한국헬스데이터그룹 활동 소개
한국헬스데이터그룹 활동 소개한국헬스데이터그룹 활동 소개
한국헬스데이터그룹 활동 소개Life Semantics, Inc.
 
유헬스 정보설계 배포용_slideshare
유헬스 정보설계 배포용_slideshare유헬스 정보설계 배포용_slideshare
유헬스 정보설계 배포용_slideshareSeungjae Song
 

Ähnlich wie 탐색적 데이터분석(국민건강보험) (10)

Big data2
Big data2Big data2
Big data2
 
헬스케어 빅데이터 동향
헬스케어 빅데이터 동향헬스케어 빅데이터 동향
헬스케어 빅데이터 동향
 
Quantified-Patient: 데이터가 매개하는 환자-의사 커뮤니케이션
Quantified-Patient: 데이터가 매개하는 환자-의사 커뮤니케이션Quantified-Patient: 데이터가 매개하는 환자-의사 커뮤니케이션
Quantified-Patient: 데이터가 매개하는 환자-의사 커뮤니케이션
 
국내외 보건의료 빅데이터 현황 및 과제
국내외 보건의료 빅데이터 현황 및 과제국내외 보건의료 빅데이터 현황 및 과제
국내외 보건의료 빅데이터 현황 및 과제
 
국내외 보건의료 빅데이터 현황 및 과제
국내외 보건의료 빅데이터 현황 및 과제국내외 보건의료 빅데이터 현황 및 과제
국내외 보건의료 빅데이터 현황 및 과제
 
병원 의료 및 제약 Bigdata 활용 마케팅전략
병원 의료 및 제약 Bigdata 활용 마케팅전략병원 의료 및 제약 Bigdata 활용 마케팅전략
병원 의료 및 제약 Bigdata 활용 마케팅전략
 
의료사업 선진화를 위한 빅데이터 분석 - 서울아산병원 심우현 교수
의료사업 선진화를 위한 빅데이터 분석 - 서울아산병원 심우현 교수의료사업 선진화를 위한 빅데이터 분석 - 서울아산병원 심우현 교수
의료사업 선진화를 위한 빅데이터 분석 - 서울아산병원 심우현 교수
 
Know Your Patient through Data!
Know Your Patient through Data!Know Your Patient through Data!
Know Your Patient through Data!
 
한국헬스데이터그룹 활동 소개
한국헬스데이터그룹 활동 소개한국헬스데이터그룹 활동 소개
한국헬스데이터그룹 활동 소개
 
유헬스 정보설계 배포용_slideshare
유헬스 정보설계 배포용_slideshare유헬스 정보설계 배포용_slideshare
유헬스 정보설계 배포용_slideshare
 

Kürzlich hochgeladen

이번에 새로 나온 코딩 테스트 합격자 되기 C++편 책을 소개하는 PPT 입니다.
이번에 새로 나온 코딩 테스트 합격자 되기 C++편 책을 소개하는 PPT 입니다.이번에 새로 나온 코딩 테스트 합격자 되기 C++편 책을 소개하는 PPT 입니다.
이번에 새로 나온 코딩 테스트 합격자 되기 C++편 책을 소개하는 PPT 입니다.ultrasuperrok
 
코딩 테스트 합격자 되기 C++ 00장~ 01장을 정리한 강의자료 입니다.
코딩 테스트 합격자 되기 C++ 00장~ 01장을 정리한 강의자료 입니다.코딩 테스트 합격자 되기 C++ 00장~ 01장을 정리한 강의자료 입니다.
코딩 테스트 합격자 되기 C++ 00장~ 01장을 정리한 강의자료 입니다.ultrasuperrok
 
TDM(Text Data Mining) Studio manual(2024)
TDM(Text Data Mining) Studio manual(2024)TDM(Text Data Mining) Studio manual(2024)
TDM(Text Data Mining) Studio manual(2024)yonseilibrary
 
친환경, 그린, 탄소저감 미래 교육 공간 디자인의 이해와 사례들에 대한 강의 자료
친환경, 그린, 탄소저감  미래 교육 공간 디자인의 이해와 사례들에 대한 강의 자료친환경, 그린, 탄소저감  미래 교육 공간 디자인의 이해와 사례들에 대한 강의 자료
친환경, 그린, 탄소저감 미래 교육 공간 디자인의 이해와 사례들에 대한 강의 자료Seongwon Kim
 
바리스타이론기초-1 수정 후 111111111111111111111111
바리스타이론기초-1 수정 후 111111111111111111111111바리스타이론기초-1 수정 후 111111111111111111111111
바리스타이론기초-1 수정 후 111111111111111111111111a01091282057
 
코딩테스트 합격자 되기 C++ 03장(시간 복잡도)를 설명한 ppt입니다
코딩테스트 합격자 되기 C++ 03장(시간 복잡도)를 설명한 ppt입니다코딩테스트 합격자 되기 C++ 03장(시간 복잡도)를 설명한 ppt입니다
코딩테스트 합격자 되기 C++ 03장(시간 복잡도)를 설명한 ppt입니다ultrasuperrok
 

Kürzlich hochgeladen (6)

이번에 새로 나온 코딩 테스트 합격자 되기 C++편 책을 소개하는 PPT 입니다.
이번에 새로 나온 코딩 테스트 합격자 되기 C++편 책을 소개하는 PPT 입니다.이번에 새로 나온 코딩 테스트 합격자 되기 C++편 책을 소개하는 PPT 입니다.
이번에 새로 나온 코딩 테스트 합격자 되기 C++편 책을 소개하는 PPT 입니다.
 
코딩 테스트 합격자 되기 C++ 00장~ 01장을 정리한 강의자료 입니다.
코딩 테스트 합격자 되기 C++ 00장~ 01장을 정리한 강의자료 입니다.코딩 테스트 합격자 되기 C++ 00장~ 01장을 정리한 강의자료 입니다.
코딩 테스트 합격자 되기 C++ 00장~ 01장을 정리한 강의자료 입니다.
 
TDM(Text Data Mining) Studio manual(2024)
TDM(Text Data Mining) Studio manual(2024)TDM(Text Data Mining) Studio manual(2024)
TDM(Text Data Mining) Studio manual(2024)
 
친환경, 그린, 탄소저감 미래 교육 공간 디자인의 이해와 사례들에 대한 강의 자료
친환경, 그린, 탄소저감  미래 교육 공간 디자인의 이해와 사례들에 대한 강의 자료친환경, 그린, 탄소저감  미래 교육 공간 디자인의 이해와 사례들에 대한 강의 자료
친환경, 그린, 탄소저감 미래 교육 공간 디자인의 이해와 사례들에 대한 강의 자료
 
바리스타이론기초-1 수정 후 111111111111111111111111
바리스타이론기초-1 수정 후 111111111111111111111111바리스타이론기초-1 수정 후 111111111111111111111111
바리스타이론기초-1 수정 후 111111111111111111111111
 
코딩테스트 합격자 되기 C++ 03장(시간 복잡도)를 설명한 ppt입니다
코딩테스트 합격자 되기 C++ 03장(시간 복잡도)를 설명한 ppt입니다코딩테스트 합격자 되기 C++ 03장(시간 복잡도)를 설명한 ppt입니다
코딩테스트 합격자 되기 C++ 03장(시간 복잡도)를 설명한 ppt입니다
 

탐색적 데이터분석(국민건강보험)

  • 2. 1. 분석동기 및 데이터 설명 대용량 데이터를 핸들링하는 스킬과 분석 이전 단계에서 자료를 탐색 적으로 살펴보아 분석 방향 설정과 전처리 과정에서 직관을 얻기 위하 여 실시하였다. 또한, 방대한 국민건강보험 데이터에 대한 이해를 도 와 현재의 국민건강보험의 대한 정보를 제공하는 데 목적이 있다. 1. 분석동기 국민건강보험 데이터는 국민건강보험 공공데이터 개방서비스에서 제공되고 있다. 개인식별정보는 제외되었으며 표번은 매년 100만명 의 무작위추출(Random Sampling)되었다. 자료는 매년 12월 2년 전 데이터를 추가하는 방식으로 직전년도 데이터는 추가되지 않는다. 여기서는 가장 최근 자료인 2015년도 데이터를 분석한다. 또한 ‘진 료내역 정보’와 ‘건강검진정보’를 주로 활용하였다. 2. 데이터 설명
  • 3. 2. 데이터 전처리 데이터셋에서 제공하는 체중과 신장을 통해 BMI 지수를 산출했다. 이는 검진정보와 민감하게 연결되어 있을 자료라 판단했기 때문이다. 1. BMI지수 산출
  • 4. 2. 데이터 전처리 ‘건강검진정보’ 데이터에서는 제공하는 진료분류기호는 매우 세분화되어 있어 이를 대분류 기준으로 변환하였다. 2. 질병코드 차원축소
  • 12. 4. 결론 - ‘진료내역 정보’와 ‘건강검진정보’를 살펴본 결과 국민건강보험은 공공부 조로의 역할을 수행한다는 사실을 확인할 수 있었다. 이는 사회적 약자인 영유아와 임산부 그리고 노년계층에게 쉽게 발생할 수 있는 질병에 대한 보장률이 높다는 데서 확인할 수 있었다. - 또한, ‘진료내역정보’를 통하여 성별과 연령별로 쉽게 발생할 수 있는 질 병을 파악할 수 있었다. - 종합적으로 살펴보면 현재 급격하게 진행되어가고 있는 노령화에 국민건 강보험이 대처하기 위해서는 부과방식(PAYG)보다는 적립방식으로 그 무게 를 더 옮겨야 한다고 생각한다.