SlideShare ist ein Scribd-Unternehmen logo
1 von 19
Downloaden Sie, um offline zu lesen
© Hitachi Vantara Corporation 2020. All Rights Reserved.© Hitachi Vantara Corporation 2020. All Rights Reserved.
Seonghun Yoo
Digital Solution, Hitachi Vantara Korea
Hitachi Vantara
- We’re Transforming, Too!
Mar 2020
© Hitachi Vantara Corporation 2020. All Rights Reserved.
▪ 1989: Hitachi Data System (mainframe)
▪ 1999: Expand into its storage business
▪ 2007: Acquired Archivas
▪ 2015: Acquired Pentaho, oXya, PentaScene
Hitachi Vantara history
▪ 2017: Launch IoT platform (Lumada)
▪ 2017: Unified Compute Platform
▪ 2017: “Hitachi Vantara” launched
▪ 2020: merge “Hitachi Consulting”
© Hitachi Vantara Corporation 2020. All Rights Reserved.
HV products for Analytics
Storage
Converged and Hyperconverged
Infrastructure
IT Operations Management
Data Protection
IoT
Data Management and Analytics
Video Intelligence
Lumada Data Services
▪ Hitachi Content Intelligence
▪ Lumada Data Lake
▪ Lumada Data Optimizer for Hadoop
Pentaho Platform
▪ Pentaho Business Analytics
▪ Pentaho Data Integration
© Hitachi Vantara Corporation 2020. All Rights Reserved.
Digital Transformation Portfolio
SOURCES DATA SERVICE INSIGHTSEDGE
Databases
Logs/Email
Social
Media
[OT SOURCES]
[IT SOURCES]
Data and
Documents
LiDAR
PLCs
Video
Lumada Data Lake
Object Store(HCP)
Integration Adapters
Local Analytics
Edge Ingestion
Device Mgt
Lumada Edge
Intelligence
Healthcare
Insights
Maintenance
Insights
Video
Insights
Custom
Solutions
Customer
Insights
Compliance
Insights
Lumada Solutions
Catalog, Governance
Search Engine(HCI)
Dataflow Services
Analytics Services
Pentaho
Dataflow Services
Analytics Services
© Hitachi Vantara Corporation 2020. All Rights Reserved.
Data monetization
Infrastructure
Data
Business
수익화
(Monetize) $
활용
Ingest Integrate Orchestrate
처리
Enrich Classify Catalog
저장
Store Manage Protect
Maximize
Return on Data
(ROD)
© Hitachi Vantara Corporation 2020. All Rights Reserved.
데이터 분석이 힘든 이유
데이터 통합
데이터 전처리
BI 및 시각화 솔루션
데이터사이언스 플랫폼
- 오픈소스
- AutoML
- 모델 관리
데이터 파이프라인 관리, 셀프서비스 분석/전처리, Workflow 관리, 스케줄링 등
분석을 하기 위한 과정이 단절되고, 다양한 도구를 사용해야 합니다.
© Hitachi Vantara Corporation 2020. All Rights Reserved.
What is DataOps?
데이터 분석 자동화를 위한 최적의 방안
DataOps
DevOps
Data Engineers
Data Scientists
자동화 + 배포 파이프라인
민첩성 + 자동화된
데이터 분석 파이프라인
© Hitachi Vantara Corporation 2020. All Rights Reserved.
Pentaho Machine Learning Orchestration
Data Pipeline for ML
Data
Explorer
Notebook
Integrations
Native
Algorithms
Catalog
Adaptive
Execution
© Hitachi Vantara Corporation 2020. All Rights Reserved.
Self-service 머신러닝
기본탑재된 알고리즘으로 코딩없이 머신러닝 모델 생성, 검증
© Hitachi Vantara Corporation 2020. All Rights Reserved.
Developed Assets
기계학습을 위한 데이터통합, 전처리, 모델링 그리고, 시각화까지 도메인별 template 제공
© Hitachi Vantara Corporation 2020. All Rights Reserved.
Developed Assets
기계학습을 위한 데이터통합, 전처리, 모델링 그리고, 시각화까지 도메인별 template 제공
© Hitachi Vantara Corporation 2020. All Rights Reserved.
Developed Assets
AutoML 알고리즘 기반 모델 (예제)
ML 예측결과 설명 (예측에 영향준 변수들의 영향도)
© Hitachi Vantara Corporation 2020. All Rights Reserved.© Hitachi Vantara Corporation 2020. All Rights Reserved.
적용사례
© Hitachi Vantara Corporation 2020. All Rights Reserved.
적용사례
Business Services Manufacturing/IoT Telecommunication
Energy/Utilities Transportation/Logistics Media/Entertainment
Financial Services Retail Healthcare/Life science
2,000개 이상의 고객사 보유, 전세계 185개국 공급
© Hitachi Vantara Corporation 2020. All Rights Reserved.
적용사례 - 금융
Script 기반 데이터처리 및 분석업무프로세스 ▶ 모듈 방식의 자동화 처리
HTTP
OpenAPI
User Group
데이터 수집
데이터 적재Impala
데이터수집/처리
XML 파싱
데이터 적재
분석
Web 데이터
외부 데이터
분석 파이프라인 자동화
국내 사례
© Hitachi Vantara Corporation 2020. All Rights Reserved.
적용사례 - 게임
빅데이터 인프라 구성
게임 API
로그데이터
(실시간)
게임 DB
스냅샷 데이터
환율 데이터
데이터 적재
User Group
Mac Client
Spoon
Mac Client
Spoon
Mac Client
Spoon
Hive
데이터 수집, 처리
Carte (Pentaho서버 클러스터링)
레포지토리
API 개발 코딩 방식의 실시간 스트리밍 데이터 처리 ▶ 코딩없이 자동화 처리
국내 사례
• Kafka 스트리밍 데이터와 Cassandra 데이터 처리량
– Kafka : 시간 당 1200만 건
– Cassandra : 시간 당 2000만 건
• Kafka 스트리밍 데이터를 실시간 집계하여 통계 정보 제공
© Hitachi Vantara Corporation 2020. All Rights Reserved.
적용사례 - 제조
사후적 대응
2 예방 정비
1 사후 정비
인력 운영 효율
저하 가능성
• 예기치 않은
Downtime 발생
• 생산 차질로 인한
손실 발생
• 건전한 설비에
인력 과다 투입
• 정비전 Trouble
발생으로
실기 및 손실
3 컨디션 기반 정비
Oil & Cooling
Valve Temperature
Vibration & Motor..
개별 변수별 모니터링
• 설비 Trouble의
입체적 원인 분석
한계
• 이미 Trouble 발생
개연성 높음
시간 기준
fail
설비 로그 수집
(RTDB)
설비
…
엔지니어
그룹
머신러닝 기반
예측 모델링
예측 모델 배포
실시간 스코어링
이력 데이터 현재 데이터
유지보수 비용
최소화
설비 trouble
사전예측
예지정비로
trouble전 사전정비
“예지정비 적용 및 보완 영역”
“기존
수행
영역”
사후 정비1
예방 정비2
컨디션 기반 정비3
fail
fail
As-is To-be
▪ 수작업 기반 이벤트처리 ▶ 데이터 분석 파이프라인 자동화 처리
▪ 운영 효율이 낮은 예방정비 ▶ AI 적용을 통한 운영 효율 극대화(예지정비)
국내 사례
© Hitachi Vantara Corporation 2020. All Rights Reserved.
Why Pentaho - Simple, but all-in-one 분석 플랫폼
1. 데이터 분석의 전과정 데이터 파이프라인 자동화
2. 구축과 운영의 단순화
3. 데이터 분석에 역량 집중
© Hitachi Vantara Corporation 2020. All Rights Reserved.© Hitachi Vantara Corporation 2020. All Rights Reserved.
Thank You

Weitere ähnliche Inhalte

Was ist angesagt?

데이터센터의 그린화 그리고 클라우드 컴퓨팅
데이터센터의 그린화 그리고 클라우드 컴퓨팅데이터센터의 그린화 그리고 클라우드 컴퓨팅
데이터센터의 그린화 그리고 클라우드 컴퓨팅Fanny Lee
 
빅데이터윈윈 컨퍼런스_대용량 데이터 분석 시스템 구축사례
빅데이터윈윈 컨퍼런스_대용량 데이터 분석 시스템 구축사례 빅데이터윈윈 컨퍼런스_대용량 데이터 분석 시스템 구축사례
빅데이터윈윈 컨퍼런스_대용량 데이터 분석 시스템 구축사례 ABRC_DATA
 
[DDC 2018] 제조분야 AI/ML 적용 사례 (Bistel, 김현진)
[DDC 2018] 제조분야 AI/ML 적용 사례 (Bistel, 김현진)[DDC 2018] 제조분야 AI/ML 적용 사례 (Bistel, 김현진)
[DDC 2018] 제조분야 AI/ML 적용 사례 (Bistel, 김현진)Metatron
 
빅데이터 윈윈 컨퍼런스-빅데이터생태계 확산전략
빅데이터 윈윈 컨퍼런스-빅데이터생태계 확산전략빅데이터 윈윈 컨퍼런스-빅데이터생태계 확산전략
빅데이터 윈윈 컨퍼런스-빅데이터생태계 확산전략ABRC_DATA
 
KOPENS OI SOLUTION v1.0
KOPENS OI SOLUTION v1.0KOPENS OI SOLUTION v1.0
KOPENS OI SOLUTION v1.0Lee Sangboo
 
빅데이터 윈윈 컨퍼런스-장비지원 사례연구
빅데이터 윈윈 컨퍼런스-장비지원 사례연구빅데이터 윈윈 컨퍼런스-장비지원 사례연구
빅데이터 윈윈 컨퍼런스-장비지원 사례연구ABRC_DATA
 
한국클라우드산업협회(Kaci) intro 2014
한국클라우드산업협회(Kaci) intro 2014한국클라우드산업협회(Kaci) intro 2014
한국클라우드산업협회(Kaci) intro 2014Chang kil Lee
 
글로벌 사례로 보는 데이터로 돈 버는 법 - 트레저데이터 (Treasure Data)
글로벌 사례로 보는 데이터로 돈 버는 법 - 트레저데이터 (Treasure Data)글로벌 사례로 보는 데이터로 돈 버는 법 - 트레저데이터 (Treasure Data)
글로벌 사례로 보는 데이터로 돈 버는 법 - 트레저데이터 (Treasure Data)Treasure Data, Inc.
 
[한국 IBM 권오윤]H2O.ai DAI & IBM GPU 서버
[한국 IBM 권오윤]H2O.ai DAI & IBM GPU 서버[한국 IBM 권오윤]H2O.ai DAI & IBM GPU 서버
[한국 IBM 권오윤]H2O.ai DAI & IBM GPU 서버오윤 권
 

Was ist angesagt? (10)

데이터센터의 그린화 그리고 클라우드 컴퓨팅
데이터센터의 그린화 그리고 클라우드 컴퓨팅데이터센터의 그린화 그리고 클라우드 컴퓨팅
데이터센터의 그린화 그리고 클라우드 컴퓨팅
 
빅데이터윈윈 컨퍼런스_대용량 데이터 분석 시스템 구축사례
빅데이터윈윈 컨퍼런스_대용량 데이터 분석 시스템 구축사례 빅데이터윈윈 컨퍼런스_대용량 데이터 분석 시스템 구축사례
빅데이터윈윈 컨퍼런스_대용량 데이터 분석 시스템 구축사례
 
INFRASTRUCTURE
INFRASTRUCTUREINFRASTRUCTURE
INFRASTRUCTURE
 
[DDC 2018] 제조분야 AI/ML 적용 사례 (Bistel, 김현진)
[DDC 2018] 제조분야 AI/ML 적용 사례 (Bistel, 김현진)[DDC 2018] 제조분야 AI/ML 적용 사례 (Bistel, 김현진)
[DDC 2018] 제조분야 AI/ML 적용 사례 (Bistel, 김현진)
 
빅데이터 윈윈 컨퍼런스-빅데이터생태계 확산전략
빅데이터 윈윈 컨퍼런스-빅데이터생태계 확산전략빅데이터 윈윈 컨퍼런스-빅데이터생태계 확산전략
빅데이터 윈윈 컨퍼런스-빅데이터생태계 확산전략
 
KOPENS OI SOLUTION v1.0
KOPENS OI SOLUTION v1.0KOPENS OI SOLUTION v1.0
KOPENS OI SOLUTION v1.0
 
빅데이터 윈윈 컨퍼런스-장비지원 사례연구
빅데이터 윈윈 컨퍼런스-장비지원 사례연구빅데이터 윈윈 컨퍼런스-장비지원 사례연구
빅데이터 윈윈 컨퍼런스-장비지원 사례연구
 
한국클라우드산업협회(Kaci) intro 2014
한국클라우드산업협회(Kaci) intro 2014한국클라우드산업협회(Kaci) intro 2014
한국클라우드산업협회(Kaci) intro 2014
 
글로벌 사례로 보는 데이터로 돈 버는 법 - 트레저데이터 (Treasure Data)
글로벌 사례로 보는 데이터로 돈 버는 법 - 트레저데이터 (Treasure Data)글로벌 사례로 보는 데이터로 돈 버는 법 - 트레저데이터 (Treasure Data)
글로벌 사례로 보는 데이터로 돈 버는 법 - 트레저데이터 (Treasure Data)
 
[한국 IBM 권오윤]H2O.ai DAI & IBM GPU 서버
[한국 IBM 권오윤]H2O.ai DAI & IBM GPU 서버[한국 IBM 권오윤]H2O.ai DAI & IBM GPU 서버
[한국 IBM 권오윤]H2O.ai DAI & IBM GPU 서버
 

Ähnlich wie Pentaho를 통한 빅데이터 분석

제조업의 AWS 기반 주요 워크로드 및 고객 사례:: 이현석::AWS Summit Seoul 2018
제조업의 AWS 기반 주요 워크로드 및 고객 사례:: 이현석::AWS Summit Seoul 2018 제조업의 AWS 기반 주요 워크로드 및 고객 사례:: 이현석::AWS Summit Seoul 2018
제조업의 AWS 기반 주요 워크로드 및 고객 사례:: 이현석::AWS Summit Seoul 2018 Amazon Web Services Korea
 
클라우드를 활용한 디지털 제조(Digital Manufacturing)실현 방법 및 사례 소개 - 윤석찬 (AWS 테크에반젤리스트) :: ...
클라우드를 활용한 디지털 제조(Digital Manufacturing)실현 방법 및 사례 소개 - 윤석찬 (AWS 테크에반젤리스트) :: ...클라우드를 활용한 디지털 제조(Digital Manufacturing)실현 방법 및 사례 소개 - 윤석찬 (AWS 테크에반젤리스트) :: ...
클라우드를 활용한 디지털 제조(Digital Manufacturing)실현 방법 및 사례 소개 - 윤석찬 (AWS 테크에반젤리스트) :: ...Amazon Web Services Korea
 
MSA(Service Mesh), MDA(Data Mesh), MIA(Inference Mesh) 기술동향 소개-박문기@메ᄀ...
MSA(Service Mesh), MDA(Data Mesh), MIA(Inference Mesh) 기술동향 소개-박문기@메ᄀ...MSA(Service Mesh), MDA(Data Mesh), MIA(Inference Mesh) 기술동향 소개-박문기@메ᄀ...
MSA(Service Mesh), MDA(Data Mesh), MIA(Inference Mesh) 기술동향 소개-박문기@메ᄀ...문기 박
 
Neural stream
Neural streamNeural stream
Neural streamMk Kim
 
고객 중심 서비스 출시를 위한 준비 “온오프라인 고객 데이터 통합” – 김준형 AWS 솔루션즈 아키텍트, 김수진 아모레퍼시픽:: AWS C...
고객 중심 서비스 출시를 위한 준비 “온오프라인 고객 데이터 통합” – 김준형 AWS 솔루션즈 아키텍트, 김수진 아모레퍼시픽:: AWS C...고객 중심 서비스 출시를 위한 준비 “온오프라인 고객 데이터 통합” – 김준형 AWS 솔루션즈 아키텍트, 김수진 아모레퍼시픽:: AWS C...
고객 중심 서비스 출시를 위한 준비 “온오프라인 고객 데이터 통합” – 김준형 AWS 솔루션즈 아키텍트, 김수진 아모레퍼시픽:: AWS C...Amazon Web Services Korea
 
클라우드는 제품 및 비즈니스 모델 혁신에 어떤 도움을 줄 수 있는가? - 김상필 솔루션즈 아키텍트 매니저, AWS / 김재우 프로, 삼성중...
클라우드는 제품 및 비즈니스 모델 혁신에 어떤 도움을 줄 수 있는가? - 김상필 솔루션즈 아키텍트 매니저, AWS / 김재우 프로, 삼성중...클라우드는 제품 및 비즈니스 모델 혁신에 어떤 도움을 줄 수 있는가? - 김상필 솔루션즈 아키텍트 매니저, AWS / 김재우 프로, 삼성중...
클라우드는 제품 및 비즈니스 모델 혁신에 어떤 도움을 줄 수 있는가? - 김상필 솔루션즈 아키텍트 매니저, AWS / 김재우 프로, 삼성중...Amazon Web Services Korea
 
RealDisplay Platform V1.5 소개
RealDisplay Platform V1.5 소개RealDisplay Platform V1.5 소개
RealDisplay Platform V1.5 소개Lee Sangboo
 
NetApp AI Control Plane
NetApp AI Control PlaneNetApp AI Control Plane
NetApp AI Control PlaneSeungYong Baek
 
세션 2: 제조업의 Digital Transformation과 AWS의 주요 기술
세션 2: 제조업의 Digital Transformation과 AWS의 주요 기술세션 2: 제조업의 Digital Transformation과 AWS의 주요 기술
세션 2: 제조업의 Digital Transformation과 AWS의 주요 기술Amazon Web Services Korea
 
2013 빅데이터 및 API 기술 현황과 전망- 윤석찬
2013 빅데이터 및 API 기술 현황과 전망- 윤석찬2013 빅데이터 및 API 기술 현황과 전망- 윤석찬
2013 빅데이터 및 API 기술 현황과 전망- 윤석찬Channy Yun
 
Pag 빅데이터-한국에도필요한가
Pag 빅데이터-한국에도필요한가Pag 빅데이터-한국에도필요한가
Pag 빅데이터-한국에도필요한가Wooseung Kim
 
Serverless Architecture를 응용한 실시간 DW 플랫폼 구현 :: 서지형 :: AWS Summit Seoul 2018
Serverless Architecture를 응용한 실시간 DW 플랫폼 구현 :: 서지형 :: AWS Summit Seoul 2018 Serverless Architecture를 응용한 실시간 DW 플랫폼 구현 :: 서지형 :: AWS Summit Seoul 2018
Serverless Architecture를 응용한 실시간 DW 플랫폼 구현 :: 서지형 :: AWS Summit Seoul 2018 Amazon Web Services Korea
 
Serverless Architecture를 응용한 실시간 DW 플랫폼 구현 :: 서지형 :: AWS Summit Seoul 2018
Serverless Architecture를 응용한 실시간 DW 플랫폼 구현 :: 서지형 :: AWS Summit Seoul 2018Serverless Architecture를 응용한 실시간 DW 플랫폼 구현 :: 서지형 :: AWS Summit Seoul 2018
Serverless Architecture를 응용한 실시간 DW 플랫폼 구현 :: 서지형 :: AWS Summit Seoul 2018Amazon Web Services Korea
 
플랜트펄스 IoT 플랫폼 소개서 - V6.0
플랜트펄스 IoT 플랫폼 소개서 - V6.0플랜트펄스 IoT 플랫폼 소개서 - V6.0
플랜트펄스 IoT 플랫폼 소개서 - V6.0Lee Sangboo
 
[AI & DevOps] BigData Scale Production AI 서비스를 위한 최상의 플랫폼 아키텍처
[AI & DevOps] BigData Scale Production AI 서비스를 위한 최상의 플랫폼 아키텍처[AI & DevOps] BigData Scale Production AI 서비스를 위한 최상의 플랫폼 아키텍처
[AI & DevOps] BigData Scale Production AI 서비스를 위한 최상의 플랫폼 아키텍처hoondong kim
 
30분만에 만드는 AWS 기반 빅데이터 분석 애플리케이션::안효빈::AWS Summit Seoul 2018
30분만에 만드는 AWS 기반 빅데이터 분석 애플리케이션::안효빈::AWS Summit Seoul 201830분만에 만드는 AWS 기반 빅데이터 분석 애플리케이션::안효빈::AWS Summit Seoul 2018
30분만에 만드는 AWS 기반 빅데이터 분석 애플리케이션::안효빈::AWS Summit Seoul 2018Amazon Web Services Korea
 
DB관점에서 본 빅데이터 (2019년 8월)
DB관점에서 본 빅데이터 (2019년 8월)DB관점에서 본 빅데이터 (2019년 8월)
DB관점에서 본 빅데이터 (2019년 8월)Kee Hoon Lee
 
빅데이터 기술 현황과 시장 전망(2014)
빅데이터 기술 현황과 시장 전망(2014)빅데이터 기술 현황과 시장 전망(2014)
빅데이터 기술 현황과 시장 전망(2014)Channy Yun
 
AWS SaaS 방식의 다양한 Chatbot Service 구축 방법::이두식::AWS Summit Seoul 2018
AWS SaaS 방식의 다양한 Chatbot Service 구축 방법::이두식::AWS Summit Seoul 2018AWS SaaS 방식의 다양한 Chatbot Service 구축 방법::이두식::AWS Summit Seoul 2018
AWS SaaS 방식의 다양한 Chatbot Service 구축 방법::이두식::AWS Summit Seoul 2018Amazon Web Services Korea
 
201210 그루터 빅데이터_플랫폼_아키텍쳐_및_솔루션_소개
201210 그루터 빅데이터_플랫폼_아키텍쳐_및_솔루션_소개201210 그루터 빅데이터_플랫폼_아키텍쳐_및_솔루션_소개
201210 그루터 빅데이터_플랫폼_아키텍쳐_및_솔루션_소개Gruter
 

Ähnlich wie Pentaho를 통한 빅데이터 분석 (20)

제조업의 AWS 기반 주요 워크로드 및 고객 사례:: 이현석::AWS Summit Seoul 2018
제조업의 AWS 기반 주요 워크로드 및 고객 사례:: 이현석::AWS Summit Seoul 2018 제조업의 AWS 기반 주요 워크로드 및 고객 사례:: 이현석::AWS Summit Seoul 2018
제조업의 AWS 기반 주요 워크로드 및 고객 사례:: 이현석::AWS Summit Seoul 2018
 
클라우드를 활용한 디지털 제조(Digital Manufacturing)실현 방법 및 사례 소개 - 윤석찬 (AWS 테크에반젤리스트) :: ...
클라우드를 활용한 디지털 제조(Digital Manufacturing)실현 방법 및 사례 소개 - 윤석찬 (AWS 테크에반젤리스트) :: ...클라우드를 활용한 디지털 제조(Digital Manufacturing)실현 방법 및 사례 소개 - 윤석찬 (AWS 테크에반젤리스트) :: ...
클라우드를 활용한 디지털 제조(Digital Manufacturing)실현 방법 및 사례 소개 - 윤석찬 (AWS 테크에반젤리스트) :: ...
 
MSA(Service Mesh), MDA(Data Mesh), MIA(Inference Mesh) 기술동향 소개-박문기@메ᄀ...
MSA(Service Mesh), MDA(Data Mesh), MIA(Inference Mesh) 기술동향 소개-박문기@메ᄀ...MSA(Service Mesh), MDA(Data Mesh), MIA(Inference Mesh) 기술동향 소개-박문기@메ᄀ...
MSA(Service Mesh), MDA(Data Mesh), MIA(Inference Mesh) 기술동향 소개-박문기@메ᄀ...
 
Neural stream
Neural streamNeural stream
Neural stream
 
고객 중심 서비스 출시를 위한 준비 “온오프라인 고객 데이터 통합” – 김준형 AWS 솔루션즈 아키텍트, 김수진 아모레퍼시픽:: AWS C...
고객 중심 서비스 출시를 위한 준비 “온오프라인 고객 데이터 통합” – 김준형 AWS 솔루션즈 아키텍트, 김수진 아모레퍼시픽:: AWS C...고객 중심 서비스 출시를 위한 준비 “온오프라인 고객 데이터 통합” – 김준형 AWS 솔루션즈 아키텍트, 김수진 아모레퍼시픽:: AWS C...
고객 중심 서비스 출시를 위한 준비 “온오프라인 고객 데이터 통합” – 김준형 AWS 솔루션즈 아키텍트, 김수진 아모레퍼시픽:: AWS C...
 
클라우드는 제품 및 비즈니스 모델 혁신에 어떤 도움을 줄 수 있는가? - 김상필 솔루션즈 아키텍트 매니저, AWS / 김재우 프로, 삼성중...
클라우드는 제품 및 비즈니스 모델 혁신에 어떤 도움을 줄 수 있는가? - 김상필 솔루션즈 아키텍트 매니저, AWS / 김재우 프로, 삼성중...클라우드는 제품 및 비즈니스 모델 혁신에 어떤 도움을 줄 수 있는가? - 김상필 솔루션즈 아키텍트 매니저, AWS / 김재우 프로, 삼성중...
클라우드는 제품 및 비즈니스 모델 혁신에 어떤 도움을 줄 수 있는가? - 김상필 솔루션즈 아키텍트 매니저, AWS / 김재우 프로, 삼성중...
 
RealDisplay Platform V1.5 소개
RealDisplay Platform V1.5 소개RealDisplay Platform V1.5 소개
RealDisplay Platform V1.5 소개
 
NetApp AI Control Plane
NetApp AI Control PlaneNetApp AI Control Plane
NetApp AI Control Plane
 
세션 2: 제조업의 Digital Transformation과 AWS의 주요 기술
세션 2: 제조업의 Digital Transformation과 AWS의 주요 기술세션 2: 제조업의 Digital Transformation과 AWS의 주요 기술
세션 2: 제조업의 Digital Transformation과 AWS의 주요 기술
 
2013 빅데이터 및 API 기술 현황과 전망- 윤석찬
2013 빅데이터 및 API 기술 현황과 전망- 윤석찬2013 빅데이터 및 API 기술 현황과 전망- 윤석찬
2013 빅데이터 및 API 기술 현황과 전망- 윤석찬
 
Pag 빅데이터-한국에도필요한가
Pag 빅데이터-한국에도필요한가Pag 빅데이터-한국에도필요한가
Pag 빅데이터-한국에도필요한가
 
Serverless Architecture를 응용한 실시간 DW 플랫폼 구현 :: 서지형 :: AWS Summit Seoul 2018
Serverless Architecture를 응용한 실시간 DW 플랫폼 구현 :: 서지형 :: AWS Summit Seoul 2018 Serverless Architecture를 응용한 실시간 DW 플랫폼 구현 :: 서지형 :: AWS Summit Seoul 2018
Serverless Architecture를 응용한 실시간 DW 플랫폼 구현 :: 서지형 :: AWS Summit Seoul 2018
 
Serverless Architecture를 응용한 실시간 DW 플랫폼 구현 :: 서지형 :: AWS Summit Seoul 2018
Serverless Architecture를 응용한 실시간 DW 플랫폼 구현 :: 서지형 :: AWS Summit Seoul 2018Serverless Architecture를 응용한 실시간 DW 플랫폼 구현 :: 서지형 :: AWS Summit Seoul 2018
Serverless Architecture를 응용한 실시간 DW 플랫폼 구현 :: 서지형 :: AWS Summit Seoul 2018
 
플랜트펄스 IoT 플랫폼 소개서 - V6.0
플랜트펄스 IoT 플랫폼 소개서 - V6.0플랜트펄스 IoT 플랫폼 소개서 - V6.0
플랜트펄스 IoT 플랫폼 소개서 - V6.0
 
[AI & DevOps] BigData Scale Production AI 서비스를 위한 최상의 플랫폼 아키텍처
[AI & DevOps] BigData Scale Production AI 서비스를 위한 최상의 플랫폼 아키텍처[AI & DevOps] BigData Scale Production AI 서비스를 위한 최상의 플랫폼 아키텍처
[AI & DevOps] BigData Scale Production AI 서비스를 위한 최상의 플랫폼 아키텍처
 
30분만에 만드는 AWS 기반 빅데이터 분석 애플리케이션::안효빈::AWS Summit Seoul 2018
30분만에 만드는 AWS 기반 빅데이터 분석 애플리케이션::안효빈::AWS Summit Seoul 201830분만에 만드는 AWS 기반 빅데이터 분석 애플리케이션::안효빈::AWS Summit Seoul 2018
30분만에 만드는 AWS 기반 빅데이터 분석 애플리케이션::안효빈::AWS Summit Seoul 2018
 
DB관점에서 본 빅데이터 (2019년 8월)
DB관점에서 본 빅데이터 (2019년 8월)DB관점에서 본 빅데이터 (2019년 8월)
DB관점에서 본 빅데이터 (2019년 8월)
 
빅데이터 기술 현황과 시장 전망(2014)
빅데이터 기술 현황과 시장 전망(2014)빅데이터 기술 현황과 시장 전망(2014)
빅데이터 기술 현황과 시장 전망(2014)
 
AWS SaaS 방식의 다양한 Chatbot Service 구축 방법::이두식::AWS Summit Seoul 2018
AWS SaaS 방식의 다양한 Chatbot Service 구축 방법::이두식::AWS Summit Seoul 2018AWS SaaS 방식의 다양한 Chatbot Service 구축 방법::이두식::AWS Summit Seoul 2018
AWS SaaS 방식의 다양한 Chatbot Service 구축 방법::이두식::AWS Summit Seoul 2018
 
201210 그루터 빅데이터_플랫폼_아키텍쳐_및_솔루션_소개
201210 그루터 빅데이터_플랫폼_아키텍쳐_및_솔루션_소개201210 그루터 빅데이터_플랫폼_아키텍쳐_및_솔루션_소개
201210 그루터 빅데이터_플랫폼_아키텍쳐_및_솔루션_소개
 

Pentaho를 통한 빅데이터 분석

  • 1. © Hitachi Vantara Corporation 2020. All Rights Reserved.© Hitachi Vantara Corporation 2020. All Rights Reserved. Seonghun Yoo Digital Solution, Hitachi Vantara Korea Hitachi Vantara - We’re Transforming, Too! Mar 2020
  • 2. © Hitachi Vantara Corporation 2020. All Rights Reserved. ▪ 1989: Hitachi Data System (mainframe) ▪ 1999: Expand into its storage business ▪ 2007: Acquired Archivas ▪ 2015: Acquired Pentaho, oXya, PentaScene Hitachi Vantara history ▪ 2017: Launch IoT platform (Lumada) ▪ 2017: Unified Compute Platform ▪ 2017: “Hitachi Vantara” launched ▪ 2020: merge “Hitachi Consulting”
  • 3. © Hitachi Vantara Corporation 2020. All Rights Reserved. HV products for Analytics Storage Converged and Hyperconverged Infrastructure IT Operations Management Data Protection IoT Data Management and Analytics Video Intelligence Lumada Data Services ▪ Hitachi Content Intelligence ▪ Lumada Data Lake ▪ Lumada Data Optimizer for Hadoop Pentaho Platform ▪ Pentaho Business Analytics ▪ Pentaho Data Integration
  • 4. © Hitachi Vantara Corporation 2020. All Rights Reserved. Digital Transformation Portfolio SOURCES DATA SERVICE INSIGHTSEDGE Databases Logs/Email Social Media [OT SOURCES] [IT SOURCES] Data and Documents LiDAR PLCs Video Lumada Data Lake Object Store(HCP) Integration Adapters Local Analytics Edge Ingestion Device Mgt Lumada Edge Intelligence Healthcare Insights Maintenance Insights Video Insights Custom Solutions Customer Insights Compliance Insights Lumada Solutions Catalog, Governance Search Engine(HCI) Dataflow Services Analytics Services Pentaho Dataflow Services Analytics Services
  • 5. © Hitachi Vantara Corporation 2020. All Rights Reserved. Data monetization Infrastructure Data Business 수익화 (Monetize) $ 활용 Ingest Integrate Orchestrate 처리 Enrich Classify Catalog 저장 Store Manage Protect Maximize Return on Data (ROD)
  • 6. © Hitachi Vantara Corporation 2020. All Rights Reserved. 데이터 분석이 힘든 이유 데이터 통합 데이터 전처리 BI 및 시각화 솔루션 데이터사이언스 플랫폼 - 오픈소스 - AutoML - 모델 관리 데이터 파이프라인 관리, 셀프서비스 분석/전처리, Workflow 관리, 스케줄링 등 분석을 하기 위한 과정이 단절되고, 다양한 도구를 사용해야 합니다.
  • 7. © Hitachi Vantara Corporation 2020. All Rights Reserved. What is DataOps? 데이터 분석 자동화를 위한 최적의 방안 DataOps DevOps Data Engineers Data Scientists 자동화 + 배포 파이프라인 민첩성 + 자동화된 데이터 분석 파이프라인
  • 8. © Hitachi Vantara Corporation 2020. All Rights Reserved. Pentaho Machine Learning Orchestration Data Pipeline for ML Data Explorer Notebook Integrations Native Algorithms Catalog Adaptive Execution
  • 9. © Hitachi Vantara Corporation 2020. All Rights Reserved. Self-service 머신러닝 기본탑재된 알고리즘으로 코딩없이 머신러닝 모델 생성, 검증
  • 10. © Hitachi Vantara Corporation 2020. All Rights Reserved. Developed Assets 기계학습을 위한 데이터통합, 전처리, 모델링 그리고, 시각화까지 도메인별 template 제공
  • 11. © Hitachi Vantara Corporation 2020. All Rights Reserved. Developed Assets 기계학습을 위한 데이터통합, 전처리, 모델링 그리고, 시각화까지 도메인별 template 제공
  • 12. © Hitachi Vantara Corporation 2020. All Rights Reserved. Developed Assets AutoML 알고리즘 기반 모델 (예제) ML 예측결과 설명 (예측에 영향준 변수들의 영향도)
  • 13. © Hitachi Vantara Corporation 2020. All Rights Reserved.© Hitachi Vantara Corporation 2020. All Rights Reserved. 적용사례
  • 14. © Hitachi Vantara Corporation 2020. All Rights Reserved. 적용사례 Business Services Manufacturing/IoT Telecommunication Energy/Utilities Transportation/Logistics Media/Entertainment Financial Services Retail Healthcare/Life science 2,000개 이상의 고객사 보유, 전세계 185개국 공급
  • 15. © Hitachi Vantara Corporation 2020. All Rights Reserved. 적용사례 - 금융 Script 기반 데이터처리 및 분석업무프로세스 ▶ 모듈 방식의 자동화 처리 HTTP OpenAPI User Group 데이터 수집 데이터 적재Impala 데이터수집/처리 XML 파싱 데이터 적재 분석 Web 데이터 외부 데이터 분석 파이프라인 자동화 국내 사례
  • 16. © Hitachi Vantara Corporation 2020. All Rights Reserved. 적용사례 - 게임 빅데이터 인프라 구성 게임 API 로그데이터 (실시간) 게임 DB 스냅샷 데이터 환율 데이터 데이터 적재 User Group Mac Client Spoon Mac Client Spoon Mac Client Spoon Hive 데이터 수집, 처리 Carte (Pentaho서버 클러스터링) 레포지토리 API 개발 코딩 방식의 실시간 스트리밍 데이터 처리 ▶ 코딩없이 자동화 처리 국내 사례 • Kafka 스트리밍 데이터와 Cassandra 데이터 처리량 – Kafka : 시간 당 1200만 건 – Cassandra : 시간 당 2000만 건 • Kafka 스트리밍 데이터를 실시간 집계하여 통계 정보 제공
  • 17. © Hitachi Vantara Corporation 2020. All Rights Reserved. 적용사례 - 제조 사후적 대응 2 예방 정비 1 사후 정비 인력 운영 효율 저하 가능성 • 예기치 않은 Downtime 발생 • 생산 차질로 인한 손실 발생 • 건전한 설비에 인력 과다 투입 • 정비전 Trouble 발생으로 실기 및 손실 3 컨디션 기반 정비 Oil & Cooling Valve Temperature Vibration & Motor.. 개별 변수별 모니터링 • 설비 Trouble의 입체적 원인 분석 한계 • 이미 Trouble 발생 개연성 높음 시간 기준 fail 설비 로그 수집 (RTDB) 설비 … 엔지니어 그룹 머신러닝 기반 예측 모델링 예측 모델 배포 실시간 스코어링 이력 데이터 현재 데이터 유지보수 비용 최소화 설비 trouble 사전예측 예지정비로 trouble전 사전정비 “예지정비 적용 및 보완 영역” “기존 수행 영역” 사후 정비1 예방 정비2 컨디션 기반 정비3 fail fail As-is To-be ▪ 수작업 기반 이벤트처리 ▶ 데이터 분석 파이프라인 자동화 처리 ▪ 운영 효율이 낮은 예방정비 ▶ AI 적용을 통한 운영 효율 극대화(예지정비) 국내 사례
  • 18. © Hitachi Vantara Corporation 2020. All Rights Reserved. Why Pentaho - Simple, but all-in-one 분석 플랫폼 1. 데이터 분석의 전과정 데이터 파이프라인 자동화 2. 구축과 운영의 단순화 3. 데이터 분석에 역량 집중
  • 19. © Hitachi Vantara Corporation 2020. All Rights Reserved.© Hitachi Vantara Corporation 2020. All Rights Reserved. Thank You