SlideShare ist ein Scribd-Unternehmen logo
1 von 33
MelOn 빅데이터 도입사례 
2014.08 
기술개발팀 윤병화PL
Profile 
• 로엔 엔터테인먼트, 멜론사업부 기술개발팀 
• MelOn 애플리케이션 아키텍트 
• 빅데이터 플랫폼 파트 리더
MelOn 
• 국내 음원 서비스 최대 2천400만 이용자, 320만 음원 보유 
• 최다 POC(Point of Customer) 앱 보유
MLCP 
• Music Life Connected Platform 
• 이해관계자의 참여를 통해 Value가 상호 교환되는 Platform을 구축 
Partner 
Center 
MelOn 
AZTalk
팬 소비지수™ 개발 
• 이용자들의 31가지 다양한 활동을 점수로 환산하여 아티스트별 팬심을 측정
Partner Center 
• 내 아티스트를 선호하는 팬 대상으로 직접적으로 Target 마케팅 가능 
• 더 많은 이용자들이 발견하여 소비를 통한 잠재팬이 될 수 있도록
Partner Center 콘텐트 등록 
• 아티스트 선호도 데이터를 이용한 Target 마케팅 
• 콘텐트 등록 시, 소식 발송 시스템에 전송 수백만 건의 데이터 입력 발생 
• 아티스트 X 이용자의 데이터양
Partner Center 콘텐트 노출
Partner Center 팬 통계 
• 콘텐트 등록에 따른 반응 분석 
• 전체 콘텐트에 대해 2014년부터 일, 주, 월간의 통계 제공 
• 이용 된 콘텐트 수 X 일 수의 데이터양
Partner Center 팬 통계
MelOn
MelOn 친밀도 
• 아티스트 친밀도를 이용한 재미 
• 친구들과의 인기도 공유 
• 이용자 X 아티스트 수의 데이터양
MelOn 친밀도 히스토리 
• 히스토리 분석과 수백억 건의 적재 데이터 
• 이용자 X 아티스트 X 항목의 데이터양
MelOn 소식 
• 아티스트가 등록한 모든 콘텐트가 이용자에게 제공 
• 이용자 X 아티스트 소식의 데이터양 (3개월 aging)
BIG DATA Volume? 
• 총 10년간 음원 소비 이력 = 877억건+ 
• 일 평균 7천만+ 스트리밍 건수 
• 월 평균 1,200만+ UV(Unique Visitors) 
• 아티스트와 이용자 연결? 아티스트 X 이용자 = 43억건+ 
• 이용자별 아티스트 친밀도 히스토리? 아티스트 X 이용자 X 항목 = 745억+ 
• 컨텐츠 이용 통계? 320만곡 X 365일 = 10억건+ 
• 일 2TB+ 데이터 생성. 현재 300TB+ 사용 중 
(최소한의 정보만 적재를 원칙으로 하며, 서비스에 따라 Aging 정책 적용 중)
MelOn 빅데이터의 현재 
• 공존! Hadoop이 잘하는 것과 Netezza가 잘하는 것은 분명 다름 
DW 분석계 
~ 2011 
서비스 분석계 
2012 ~
빅데이터 솔루션 선택 기준 
• 분석 관점 
• 기존 자바와 오라클을 이용한 배치 애플리케이션의 한계 
• 방대한양의 분석 결과 보관 및 재사용 
• 다양한 분석 알고리즘 부재 
• 서비스 관점 
• 방대한양의 분석 결과 적재 가능 
• 대량 데이터 온라인 입력, 조회 가능 
• 2011년 RDBMS를 이용한 소식 서비스의 부하 경험
빅데이터 솔루션 선택(2011년 하반기 시점) 
• 오픈 소스 고민 사항 
• 내부 인력 부재 
• 안정성 불안 
• 상용 솔루션 
• 고비용 필요 
• 알고리즘 개발 필요 
• 레퍼런스 부족 
• SPADE 
• 지속적인 기술지원에 대한 의문 
• MLCP 발전 따른 추가 개발 요소 필요 
• 안정적 대용량 데이터 서비스 
• 머신러닝 CF를 이용한 추천 필요 
오픈 소스 기반 하둡, HBase, Mahout] 
단, 기술 내재화를 가능케 할 파트너 필요
MelOn 프로젝트의 키 
• 기술 내재화 
• 기술을 위해서가 아닌 비즈니스가 우선
Hadoop 배포판 
• 프로젝트 최초 선택 
• 2011년 HA 지원여부에 따른 선택 CDH4 
• 현재 Apache Hadoop 2.5, HBase 0.98 
MelOn CDH 5.0 (Hadoop 2.3, HBase 0.96)
아키텍처 
• 수집  분석  서비스 
• 유실 허용에 따른 수집 아키텍처 선택 
• 가능한 서비스는 MariaDB로 Bulk 업로드 후 이용 
Web 
App Agent 
Apps 
Hudson 
(배치 수집) 
MR / Hive / Mahout / Tajo 
<<분석>> 
Flume 
(실시간 수집) 
HBase / API / 실시간 
<<서비스>> 
Hudson 
(배치 적재) 
Sqoop 
(배치 수집) 
Oracle 
MariaDB 
Netezza
실시간 수집 분석 
• Flume 이용 
• HDFS 적재 후 실시간 처리 데몬이 처리 
• Flume vs Kafka  성숙도, 숙련도, 지원 도구 
5분 차트 
최근 들은 곡
대용량 누적 적재 
• 단순 Summary 하지만 좋은 서비스 
• 10년간의 모든 이용자의 데이터 누적 서비스
과유불급 
• ROI를 검토를 통한 데이터 적재 최소화 
• HBase의 Secondary Index는 큰 비용으로 친밀도 정렬 ROI 검토
Win! Win! 
• 잘하는 것을 항상 이용 함 
• 분석은 Hive, 서비스는 MariaDB
특성에 맞는 분석 
• Hive vs MapReduce  유지보수성 vs 성능 
• Hive + MapReduce(Mahout 포함)  Hybrid
내 것의 소중함 
• 하둡 workflow 엔진 Oozie vs Hudson 
• 관리측면에서 기 사용중인 Hudson 유지 
• 2014년 8월 현재 417개 분석/적재 배치
하둡에서 배운 점 
• 간단한 연산도 신중히 
• 데이터형 변환의 비용 
• 실수 연수의 비용 
• SimpleDateFormat 등 객체 재사용(온라인 애플리케이션에선 절대 재사용 안함) 
• 네트워크 사용량 예측 
• 클러스터간 데이터 복제 시 내부 네트워크 1g 모두 사용 
• 10g로 내부 네트워크 전환 
• 복제 시 전송량 제한 
• 적당한 부하 
• 무리한 워크로드는 장비 고장 유발 
• 분석 배치 스케줄 분산 필요 
• 하둡 버전 업그레이드는 신중히(CDH 4  5전환) 
• Hive 내부 처리 변경(예: 수치 계산 ‘NaN’  null) 
• 서비스에 맞는 튜닝 
• 인터넷에는 오래된 가이드 또는 버전 별로 설정 다름 
• 최신 하둡 버전은 더 많은 Heap 영역 요구
인프라에서 배운 점 
• No저비용 
• 제한적인 상면 공간 
• 유지보수 업체는 선택이 아닌 필수 
• 10g 이더넷, HDD 등 자잘한 추가 비용 
• 잦은 H/W 고장 
• 분석 시 평균 로드가 70%이상. CPU 팬, 디스크, 컨트롤러, 메모리 등 다양함 
• 운영계약이 필수가 되는 요인 
• OMC 등의 장애 감지 시스템은 필수(프로세스, 로그, 시스템 상태 등 감시) 
• 하둡 에코시스템에 특화된 모니터링 도구도 필수 
• 주요 분석은 업무시간에 수행 
• 제한된 운영 및 관제 인력 
• 하둡 이해도의 한계 
• 자동화 지원 도구(CMS 등) 필요. 마음은 chef 현실은 rsync 
• 전문 관제 인력 전무. 매뉴얼 적인 업무 수행 
• 인프라 입장의 하둡 플랫폼에 대해 지속적인 학습 필요
개발에서 배운 점 
• 하늘의 별 따기 하둡 개발자 모시기 
• MelOn 만의 고민은 아님 
• 개발자 백업 체계 문제 
• 트러블슈팅의 한계 
• 내부 스터디 및 전문 회사와 협력 관계 필수 
• 프레임워크는 아니어도 공통화는 필수 
• 데이터에 대한 시야 
• 기획자/개발자 모두 필요 
• 도메인 지식 필수, 통계적 마인드 필요. 
• 사견은 MelOn에 데이터 사이언티스트는 있음. 
• HBase 특성에 따른 제약 
• Contingency Plan 필요에 따른 구현 난이도 향상 
(2달간 한번도 발생한 적 없음) 
• 정렬의 어려움 
• 페이징처리의 제한 
• 1천만건 이하는 MariaDB 이용
프로세스 
• 서비스 기획팀: 데이터 분석 룰 수립 및 결과 검토 
• 통계 및 서비스를 위한 룰(공식) 정의 
• 분석 데이터 결과 검토 
• 기술 개발팀: 개발 및 플랫폼 운영 지원 
• 하둡 플랫폼 운영 
• 분석 룰 개발 
• 서비스 API 개발 
그루터 
하둡 플랫폼 기술 지원 
운영 지원 
개발 요건(룰) 전달 
및 검토 
개발 및 피드백 
서비스 기획팀 기술 개발팀
향후 과제: 추천 
• 소비가 쉽고, 콘텐트가 많은 MelOn 
• 웨어러블 디바이스, 스마트카의 등장 
• 추천은 반드시 필요 
• MelOn이 생각하는 추천 
• 메타 기반 추천 
• 콘텐트 기반 추천 
• 고객 이력 기반 추천 
• 결론은 하이브리드와 이용자 컨텍스트에 대한 이해
Q & A 
combine at iloen.com

Weitere ähnliche Inhalte

Was ist angesagt?

Daum내부 Hadoop 활용 사례 | Devon 2012
Daum내부 Hadoop 활용 사례 | Devon 2012Daum내부 Hadoop 활용 사례 | Devon 2012
Daum내부 Hadoop 활용 사례 | Devon 2012Daum DNA
 
대용량 분산 아키텍쳐 설계 #2 대용량 분산 시스템 아키텍쳐 디자인 패턴
대용량 분산 아키텍쳐 설계 #2 대용량 분산 시스템 아키텍쳐 디자인 패턴대용량 분산 아키텍쳐 설계 #2 대용량 분산 시스템 아키텍쳐 디자인 패턴
대용량 분산 아키텍쳐 설계 #2 대용량 분산 시스템 아키텍쳐 디자인 패턴Terry Cho
 
OLAP for Big Data (Druid vs Apache Kylin vs Apache Lens)
OLAP for Big Data (Druid vs Apache Kylin vs Apache Lens)OLAP for Big Data (Druid vs Apache Kylin vs Apache Lens)
OLAP for Big Data (Druid vs Apache Kylin vs Apache Lens)SANG WON PARK
 
Tajo TPC-H Benchmark Test on AWS
Tajo TPC-H Benchmark Test on AWSTajo TPC-H Benchmark Test on AWS
Tajo TPC-H Benchmark Test on AWSGruter
 
SQL-on-Hadoop with Apache Tajo, and application case of SK Telecom
SQL-on-Hadoop with Apache Tajo,  and application case of SK TelecomSQL-on-Hadoop with Apache Tajo,  and application case of SK Telecom
SQL-on-Hadoop with Apache Tajo, and application case of SK TelecomGruter
 
Amazon Redshift의 이해와 활용 (김용우) - AWS DB Day
Amazon Redshift의 이해와 활용 (김용우) - AWS DB DayAmazon Redshift의 이해와 활용 (김용우) - AWS DB Day
Amazon Redshift의 이해와 활용 (김용우) - AWS DB DayAmazon Web Services Korea
 
줌인터넷 빅데이터 활용사례 김우승
줌인터넷 빅데이터 활용사례 김우승줌인터넷 빅데이터 활용사례 김우승
줌인터넷 빅데이터 활용사례 김우승Wooseung Kim
 
SQL-on-Hadoop 그리고 Tajo - Tech Planet 2013
SQL-on-Hadoop 그리고 Tajo - Tech Planet 2013SQL-on-Hadoop 그리고 Tajo - Tech Planet 2013
SQL-on-Hadoop 그리고 Tajo - Tech Planet 2013Hyunsik Choi
 
Apache hbase overview (20160427)
Apache hbase overview (20160427)Apache hbase overview (20160427)
Apache hbase overview (20160427)Steve Min
 
빅데이터, big data
빅데이터, big data빅데이터, big data
빅데이터, big dataH K Yoon
 
빅데이터 기술 현황과 시장 전망(2014)
빅데이터 기술 현황과 시장 전망(2014)빅데이터 기술 현황과 시장 전망(2014)
빅데이터 기술 현황과 시장 전망(2014)Channy Yun
 
Apache Hive: for business intelligence use and real-time I/O use (Korean)
Apache Hive: for business intelligence use and real-time I/O use (Korean)Apache Hive: for business intelligence use and real-time I/O use (Korean)
Apache Hive: for business intelligence use and real-time I/O use (Korean)Teddy Choi
 
Spark와 Hadoop, 완벽한 조합 (한국어)
Spark와 Hadoop, 완벽한 조합 (한국어)Spark와 Hadoop, 완벽한 조합 (한국어)
Spark와 Hadoop, 완벽한 조합 (한국어)Teddy Choi
 
Tajo and SQL-on-Hadoop in Tech Planet 2013
Tajo and SQL-on-Hadoop in Tech Planet 2013Tajo and SQL-on-Hadoop in Tech Planet 2013
Tajo and SQL-on-Hadoop in Tech Planet 2013Gruter
 
DeView2013 Big Data Platform Architecture with Hadoop - Hyeong-jun Kim
DeView2013 Big Data Platform Architecture with Hadoop - Hyeong-jun KimDeView2013 Big Data Platform Architecture with Hadoop - Hyeong-jun Kim
DeView2013 Big Data Platform Architecture with Hadoop - Hyeong-jun KimGruter
 
서울 하둡 사용자 모임 발표자료
서울 하둡 사용자 모임 발표자료서울 하둡 사용자 모임 발표자료
서울 하둡 사용자 모임 발표자료Teddy Choi
 
Io t에서 big data를 통합하는 통합 빅데이터 플랫폼 flamingo_클라우다인_김병곤 대표이사
Io t에서 big data를 통합하는 통합 빅데이터 플랫폼 flamingo_클라우다인_김병곤 대표이사Io t에서 big data를 통합하는 통합 빅데이터 플랫폼 flamingo_클라우다인_김병곤 대표이사
Io t에서 big data를 통합하는 통합 빅데이터 플랫폼 flamingo_클라우다인_김병곤 대표이사uEngine Solutions
 
Big Data Overview
Big Data OverviewBig Data Overview
Big Data OverviewKeeyong Han
 

Was ist angesagt? (20)

Daum내부 Hadoop 활용 사례 | Devon 2012
Daum내부 Hadoop 활용 사례 | Devon 2012Daum내부 Hadoop 활용 사례 | Devon 2012
Daum내부 Hadoop 활용 사례 | Devon 2012
 
대용량 분산 아키텍쳐 설계 #2 대용량 분산 시스템 아키텍쳐 디자인 패턴
대용량 분산 아키텍쳐 설계 #2 대용량 분산 시스템 아키텍쳐 디자인 패턴대용량 분산 아키텍쳐 설계 #2 대용량 분산 시스템 아키텍쳐 디자인 패턴
대용량 분산 아키텍쳐 설계 #2 대용량 분산 시스템 아키텍쳐 디자인 패턴
 
OLAP for Big Data (Druid vs Apache Kylin vs Apache Lens)
OLAP for Big Data (Druid vs Apache Kylin vs Apache Lens)OLAP for Big Data (Druid vs Apache Kylin vs Apache Lens)
OLAP for Big Data (Druid vs Apache Kylin vs Apache Lens)
 
Tajo TPC-H Benchmark Test on AWS
Tajo TPC-H Benchmark Test on AWSTajo TPC-H Benchmark Test on AWS
Tajo TPC-H Benchmark Test on AWS
 
SQL-on-Hadoop with Apache Tajo, and application case of SK Telecom
SQL-on-Hadoop with Apache Tajo,  and application case of SK TelecomSQL-on-Hadoop with Apache Tajo,  and application case of SK Telecom
SQL-on-Hadoop with Apache Tajo, and application case of SK Telecom
 
Amazon Redshift의 이해와 활용 (김용우) - AWS DB Day
Amazon Redshift의 이해와 활용 (김용우) - AWS DB DayAmazon Redshift의 이해와 활용 (김용우) - AWS DB Day
Amazon Redshift의 이해와 활용 (김용우) - AWS DB Day
 
줌인터넷 빅데이터 활용사례 김우승
줌인터넷 빅데이터 활용사례 김우승줌인터넷 빅데이터 활용사례 김우승
줌인터넷 빅데이터 활용사례 김우승
 
SQL-on-Hadoop 그리고 Tajo - Tech Planet 2013
SQL-on-Hadoop 그리고 Tajo - Tech Planet 2013SQL-on-Hadoop 그리고 Tajo - Tech Planet 2013
SQL-on-Hadoop 그리고 Tajo - Tech Planet 2013
 
Apache hbase overview (20160427)
Apache hbase overview (20160427)Apache hbase overview (20160427)
Apache hbase overview (20160427)
 
빅데이터, big data
빅데이터, big data빅데이터, big data
빅데이터, big data
 
빅데이터 기술 현황과 시장 전망(2014)
빅데이터 기술 현황과 시장 전망(2014)빅데이터 기술 현황과 시장 전망(2014)
빅데이터 기술 현황과 시장 전망(2014)
 
Apache Hive: for business intelligence use and real-time I/O use (Korean)
Apache Hive: for business intelligence use and real-time I/O use (Korean)Apache Hive: for business intelligence use and real-time I/O use (Korean)
Apache Hive: for business intelligence use and real-time I/O use (Korean)
 
Apache Kylin
Apache KylinApache Kylin
Apache Kylin
 
Spark와 Hadoop, 완벽한 조합 (한국어)
Spark와 Hadoop, 완벽한 조합 (한국어)Spark와 Hadoop, 완벽한 조합 (한국어)
Spark와 Hadoop, 완벽한 조합 (한국어)
 
Tajo and SQL-on-Hadoop in Tech Planet 2013
Tajo and SQL-on-Hadoop in Tech Planet 2013Tajo and SQL-on-Hadoop in Tech Planet 2013
Tajo and SQL-on-Hadoop in Tech Planet 2013
 
DeView2013 Big Data Platform Architecture with Hadoop - Hyeong-jun Kim
DeView2013 Big Data Platform Architecture with Hadoop - Hyeong-jun KimDeView2013 Big Data Platform Architecture with Hadoop - Hyeong-jun Kim
DeView2013 Big Data Platform Architecture with Hadoop - Hyeong-jun Kim
 
서울 하둡 사용자 모임 발표자료
서울 하둡 사용자 모임 발표자료서울 하둡 사용자 모임 발표자료
서울 하둡 사용자 모임 발표자료
 
Io t에서 big data를 통합하는 통합 빅데이터 플랫폼 flamingo_클라우다인_김병곤 대표이사
Io t에서 big data를 통합하는 통합 빅데이터 플랫폼 flamingo_클라우다인_김병곤 대표이사Io t에서 big data를 통합하는 통합 빅데이터 플랫폼 flamingo_클라우다인_김병곤 대표이사
Io t에서 big data를 통합하는 통합 빅데이터 플랫폼 flamingo_클라우다인_김병곤 대표이사
 
Big Data Overview
Big Data OverviewBig Data Overview
Big Data Overview
 
Druid+superset
Druid+supersetDruid+superset
Druid+superset
 

Ähnlich wie Gruter TECHDAY 2014 MelOn BigData

201210 그루터 빅데이터_플랫폼_아키텍쳐_및_솔루션_소개
201210 그루터 빅데이터_플랫폼_아키텍쳐_및_솔루션_소개201210 그루터 빅데이터_플랫폼_아키텍쳐_및_솔루션_소개
201210 그루터 빅데이터_플랫폼_아키텍쳐_및_솔루션_소개Gruter
 
Daum’s Business Analytics Use-cases based on Bigdata technology (2012)
Daum’s Business Analytics Use-cases based on Bigdata technology (2012)Daum’s Business Analytics Use-cases based on Bigdata technology (2012)
Daum’s Business Analytics Use-cases based on Bigdata technology (2012)Channy Yun
 
태블로 소프트웨어(Tableau Software) 소개
태블로 소프트웨어(Tableau Software) 소개태블로 소프트웨어(Tableau Software) 소개
태블로 소프트웨어(Tableau Software) 소개HT Kim
 
GRUTER가 들려주는 Big Data Platform 구축 전략과 적용 사례: GRUTER의 빅데이터 플랫폼 및 전략 소개
GRUTER가 들려주는 Big Data Platform 구축 전략과 적용 사례: GRUTER의 빅데이터 플랫폼 및 전략 소개GRUTER가 들려주는 Big Data Platform 구축 전략과 적용 사례: GRUTER의 빅데이터 플랫폼 및 전략 소개
GRUTER가 들려주는 Big Data Platform 구축 전략과 적용 사례: GRUTER의 빅데이터 플랫폼 및 전략 소개Gruter
 
[Td 2015]microsoft 개발자들을 위한 달콤한 hadoop, hd insight(최종욱)
[Td 2015]microsoft 개발자들을 위한 달콤한 hadoop, hd insight(최종욱)[Td 2015]microsoft 개발자들을 위한 달콤한 hadoop, hd insight(최종욱)
[Td 2015]microsoft 개발자들을 위한 달콤한 hadoop, hd insight(최종욱)Sang Don Kim
 
Big data application architecture 요약2
Big data application architecture 요약2Big data application architecture 요약2
Big data application architecture 요약2Seong-Bok Lee
 
[Pgday.Seoul 2018] replacing oracle with edb postgres
[Pgday.Seoul 2018] replacing oracle with edb postgres[Pgday.Seoul 2018] replacing oracle with edb postgres
[Pgday.Seoul 2018] replacing oracle with edb postgresPgDay.Seoul
 
2017 주요 기술 흐름 및 개요
2017 주요 기술 흐름 및 개요2017 주요 기술 흐름 및 개요
2017 주요 기술 흐름 및 개요Hosung Lee
 
SQream DB, GPU-accelerated data warehouse
SQream DB, GPU-accelerated data warehouseSQream DB, GPU-accelerated data warehouse
SQream DB, GPU-accelerated data warehouseNAVER Engineering
 
OpenSource Big Data Platform : Flamingo Project
OpenSource Big Data Platform : Flamingo ProjectOpenSource Big Data Platform : Flamingo Project
OpenSource Big Data Platform : Flamingo ProjectBYOUNG GON KIM
 
OpenSource Big Data Platform - Flamingo v7
OpenSource Big Data Platform - Flamingo v7OpenSource Big Data Platform - Flamingo v7
OpenSource Big Data Platform - Flamingo v7BYOUNG GON KIM
 
OpenSource Big Data Platform - Flamingo 소개와 활용
OpenSource Big Data Platform - Flamingo 소개와 활용OpenSource Big Data Platform - Flamingo 소개와 활용
OpenSource Big Data Platform - Flamingo 소개와 활용BYOUNG GON KIM
 
AWS Finance Symposium_바로 도입할 수 있는 금융권 업무의 클라우드 아키텍처 알아보기
AWS Finance Symposium_바로 도입할 수 있는 금융권 업무의 클라우드 아키텍처 알아보기AWS Finance Symposium_바로 도입할 수 있는 금융권 업무의 클라우드 아키텍처 알아보기
AWS Finance Symposium_바로 도입할 수 있는 금융권 업무의 클라우드 아키텍처 알아보기Amazon Web Services Korea
 
빅데이터 솔루션 소개서(2013년 05월)
빅데이터 솔루션 소개서(2013년 05월)빅데이터 솔루션 소개서(2013년 05월)
빅데이터 솔루션 소개서(2013년 05월)동학 노
 
확장가능한 웹 아키텍쳐 구축 방안
확장가능한 웹 아키텍쳐 구축 방안 확장가능한 웹 아키텍쳐 구축 방안
확장가능한 웹 아키텍쳐 구축 방안 IMQA
 
고성능 빅데이터 수집 및 분석 솔루션 - 티맥스소프트 허승재 팀장
고성능 빅데이터 수집 및 분석 솔루션 - 티맥스소프트 허승재 팀장고성능 빅데이터 수집 및 분석 솔루션 - 티맥스소프트 허승재 팀장
고성능 빅데이터 수집 및 분석 솔루션 - 티맥스소프트 허승재 팀장eungjin cho
 
클라우드 이행전략과 HP의 사례
클라우드 이행전략과 HP의 사례클라우드 이행전략과 HP의 사례
클라우드 이행전략과 HP의 사례Seong-Bok Lee
 
Pag 빅데이터-한국에도필요한가
Pag 빅데이터-한국에도필요한가Pag 빅데이터-한국에도필요한가
Pag 빅데이터-한국에도필요한가Wooseung Kim
 
The Data tech for AI based innovation(기업의 AI기반 혁신을 지원하는 데이터 기술)
The Data tech for AI based innovation(기업의 AI기반 혁신을 지원하는 데이터 기술)The Data tech for AI based innovation(기업의 AI기반 혁신을 지원하는 데이터 기술)
The Data tech for AI based innovation(기업의 AI기반 혁신을 지원하는 데이터 기술)SANG WON PARK
 

Ähnlich wie Gruter TECHDAY 2014 MelOn BigData (20)

201210 그루터 빅데이터_플랫폼_아키텍쳐_및_솔루션_소개
201210 그루터 빅데이터_플랫폼_아키텍쳐_및_솔루션_소개201210 그루터 빅데이터_플랫폼_아키텍쳐_및_솔루션_소개
201210 그루터 빅데이터_플랫폼_아키텍쳐_및_솔루션_소개
 
Daum’s Business Analytics Use-cases based on Bigdata technology (2012)
Daum’s Business Analytics Use-cases based on Bigdata technology (2012)Daum’s Business Analytics Use-cases based on Bigdata technology (2012)
Daum’s Business Analytics Use-cases based on Bigdata technology (2012)
 
태블로 소프트웨어(Tableau Software) 소개
태블로 소프트웨어(Tableau Software) 소개태블로 소프트웨어(Tableau Software) 소개
태블로 소프트웨어(Tableau Software) 소개
 
GRUTER가 들려주는 Big Data Platform 구축 전략과 적용 사례: GRUTER의 빅데이터 플랫폼 및 전략 소개
GRUTER가 들려주는 Big Data Platform 구축 전략과 적용 사례: GRUTER의 빅데이터 플랫폼 및 전략 소개GRUTER가 들려주는 Big Data Platform 구축 전략과 적용 사례: GRUTER의 빅데이터 플랫폼 및 전략 소개
GRUTER가 들려주는 Big Data Platform 구축 전략과 적용 사례: GRUTER의 빅데이터 플랫폼 및 전략 소개
 
[Td 2015]microsoft 개발자들을 위한 달콤한 hadoop, hd insight(최종욱)
[Td 2015]microsoft 개발자들을 위한 달콤한 hadoop, hd insight(최종욱)[Td 2015]microsoft 개발자들을 위한 달콤한 hadoop, hd insight(최종욱)
[Td 2015]microsoft 개발자들을 위한 달콤한 hadoop, hd insight(최종욱)
 
Big data application architecture 요약2
Big data application architecture 요약2Big data application architecture 요약2
Big data application architecture 요약2
 
[Pgday.Seoul 2018] replacing oracle with edb postgres
[Pgday.Seoul 2018] replacing oracle with edb postgres[Pgday.Seoul 2018] replacing oracle with edb postgres
[Pgday.Seoul 2018] replacing oracle with edb postgres
 
2017 주요 기술 흐름 및 개요
2017 주요 기술 흐름 및 개요2017 주요 기술 흐름 및 개요
2017 주요 기술 흐름 및 개요
 
SQream DB, GPU-accelerated data warehouse
SQream DB, GPU-accelerated data warehouseSQream DB, GPU-accelerated data warehouse
SQream DB, GPU-accelerated data warehouse
 
Flamingo project v4
Flamingo project v4Flamingo project v4
Flamingo project v4
 
OpenSource Big Data Platform : Flamingo Project
OpenSource Big Data Platform : Flamingo ProjectOpenSource Big Data Platform : Flamingo Project
OpenSource Big Data Platform : Flamingo Project
 
OpenSource Big Data Platform - Flamingo v7
OpenSource Big Data Platform - Flamingo v7OpenSource Big Data Platform - Flamingo v7
OpenSource Big Data Platform - Flamingo v7
 
OpenSource Big Data Platform - Flamingo 소개와 활용
OpenSource Big Data Platform - Flamingo 소개와 활용OpenSource Big Data Platform - Flamingo 소개와 활용
OpenSource Big Data Platform - Flamingo 소개와 활용
 
AWS Finance Symposium_바로 도입할 수 있는 금융권 업무의 클라우드 아키텍처 알아보기
AWS Finance Symposium_바로 도입할 수 있는 금융권 업무의 클라우드 아키텍처 알아보기AWS Finance Symposium_바로 도입할 수 있는 금융권 업무의 클라우드 아키텍처 알아보기
AWS Finance Symposium_바로 도입할 수 있는 금융권 업무의 클라우드 아키텍처 알아보기
 
빅데이터 솔루션 소개서(2013년 05월)
빅데이터 솔루션 소개서(2013년 05월)빅데이터 솔루션 소개서(2013년 05월)
빅데이터 솔루션 소개서(2013년 05월)
 
확장가능한 웹 아키텍쳐 구축 방안
확장가능한 웹 아키텍쳐 구축 방안 확장가능한 웹 아키텍쳐 구축 방안
확장가능한 웹 아키텍쳐 구축 방안
 
고성능 빅데이터 수집 및 분석 솔루션 - 티맥스소프트 허승재 팀장
고성능 빅데이터 수집 및 분석 솔루션 - 티맥스소프트 허승재 팀장고성능 빅데이터 수집 및 분석 솔루션 - 티맥스소프트 허승재 팀장
고성능 빅데이터 수집 및 분석 솔루션 - 티맥스소프트 허승재 팀장
 
클라우드 이행전략과 HP의 사례
클라우드 이행전략과 HP의 사례클라우드 이행전략과 HP의 사례
클라우드 이행전략과 HP의 사례
 
Pag 빅데이터-한국에도필요한가
Pag 빅데이터-한국에도필요한가Pag 빅데이터-한국에도필요한가
Pag 빅데이터-한국에도필요한가
 
The Data tech for AI based innovation(기업의 AI기반 혁신을 지원하는 데이터 기술)
The Data tech for AI based innovation(기업의 AI기반 혁신을 지원하는 데이터 기술)The Data tech for AI based innovation(기업의 AI기반 혁신을 지원하는 데이터 기술)
The Data tech for AI based innovation(기업의 AI기반 혁신을 지원하는 데이터 기술)
 

Mehr von Gruter

MelOn 빅데이터 플랫폼과 Tajo 이야기
MelOn 빅데이터 플랫폼과 Tajo 이야기MelOn 빅데이터 플랫폼과 Tajo 이야기
MelOn 빅데이터 플랫폼과 Tajo 이야기Gruter
 
Introduction to Apache Tajo: Future of Data Warehouse
Introduction to Apache Tajo: Future of Data WarehouseIntroduction to Apache Tajo: Future of Data Warehouse
Introduction to Apache Tajo: Future of Data WarehouseGruter
 
Expanding Your Data Warehouse with Tajo
Expanding Your Data Warehouse with TajoExpanding Your Data Warehouse with Tajo
Expanding Your Data Warehouse with TajoGruter
 
Introduction to Apache Tajo: Data Warehouse for Big Data
Introduction to Apache Tajo: Data Warehouse for Big DataIntroduction to Apache Tajo: Data Warehouse for Big Data
Introduction to Apache Tajo: Data Warehouse for Big DataGruter
 
스타트업사례로 본 로그 데이터분석 : Tajo on AWS
스타트업사례로 본 로그 데이터분석 : Tajo on AWS스타트업사례로 본 로그 데이터분석 : Tajo on AWS
스타트업사례로 본 로그 데이터분석 : Tajo on AWSGruter
 
What's New Tajo 0.10 and Its Beyond
What's New Tajo 0.10 and Its BeyondWhat's New Tajo 0.10 and Its Beyond
What's New Tajo 0.10 and Its BeyondGruter
 
Efficient In­‐situ Processing of Various Storage Types on Apache Tajo
Efficient In­‐situ Processing of Various Storage Types on Apache TajoEfficient In­‐situ Processing of Various Storage Types on Apache Tajo
Efficient In­‐situ Processing of Various Storage Types on Apache TajoGruter
 
Data analysis with Tajo
Data analysis with TajoData analysis with Tajo
Data analysis with TajoGruter
 
Gruter TECHDAY 2014 Realtime Processing in Telco
Gruter TECHDAY 2014 Realtime Processing in TelcoGruter TECHDAY 2014 Realtime Processing in Telco
Gruter TECHDAY 2014 Realtime Processing in TelcoGruter
 
Gruter_TECHDAY_2014_04_TajoCloudHandsOn (in Korean)
Gruter_TECHDAY_2014_04_TajoCloudHandsOn (in Korean)Gruter_TECHDAY_2014_04_TajoCloudHandsOn (in Korean)
Gruter_TECHDAY_2014_04_TajoCloudHandsOn (in Korean)Gruter
 
Gruter_TECHDAY_2014_03_ApacheTajo (in Korean)
Gruter_TECHDAY_2014_03_ApacheTajo (in Korean)Gruter_TECHDAY_2014_03_ApacheTajo (in Korean)
Gruter_TECHDAY_2014_03_ApacheTajo (in Korean)Gruter
 
Gruter_TECHDAY_2014_01_SearchEngine (in Korean)
Gruter_TECHDAY_2014_01_SearchEngine (in Korean)Gruter_TECHDAY_2014_01_SearchEngine (in Korean)
Gruter_TECHDAY_2014_01_SearchEngine (in Korean)Gruter
 
Apache Tajo - BWC 2014
Apache Tajo - BWC 2014Apache Tajo - BWC 2014
Apache Tajo - BWC 2014Gruter
 
Elastic Search Performance Optimization - Deview 2014
Elastic Search Performance Optimization - Deview 2014Elastic Search Performance Optimization - Deview 2014
Elastic Search Performance Optimization - Deview 2014Gruter
 
Hadoop security DeView 2014
Hadoop security DeView 2014Hadoop security DeView 2014
Hadoop security DeView 2014Gruter
 
Vectorized processing in_a_nutshell_DeView2014
Vectorized processing in_a_nutshell_DeView2014Vectorized processing in_a_nutshell_DeView2014
Vectorized processing in_a_nutshell_DeView2014Gruter
 
Big Data Camp LA 2014 - Apache Tajo: A Big Data Warehouse System on Hadoop
Big Data Camp LA 2014 - Apache Tajo: A Big Data Warehouse System on HadoopBig Data Camp LA 2014 - Apache Tajo: A Big Data Warehouse System on Hadoop
Big Data Camp LA 2014 - Apache Tajo: A Big Data Warehouse System on HadoopGruter
 
Hadoop Summit 2014: Query Optimization and JIT-based Vectorized Execution in ...
Hadoop Summit 2014: Query Optimization and JIT-based Vectorized Execution in ...Hadoop Summit 2014: Query Optimization and JIT-based Vectorized Execution in ...
Hadoop Summit 2014: Query Optimization and JIT-based Vectorized Execution in ...Gruter
 
Cloumon sw제품설명회 발표자료
Cloumon sw제품설명회 발표자료Cloumon sw제품설명회 발표자료
Cloumon sw제품설명회 발표자료Gruter
 
Tajo case study bay area hug 20131105
Tajo case study bay area hug 20131105Tajo case study bay area hug 20131105
Tajo case study bay area hug 20131105Gruter
 

Mehr von Gruter (20)

MelOn 빅데이터 플랫폼과 Tajo 이야기
MelOn 빅데이터 플랫폼과 Tajo 이야기MelOn 빅데이터 플랫폼과 Tajo 이야기
MelOn 빅데이터 플랫폼과 Tajo 이야기
 
Introduction to Apache Tajo: Future of Data Warehouse
Introduction to Apache Tajo: Future of Data WarehouseIntroduction to Apache Tajo: Future of Data Warehouse
Introduction to Apache Tajo: Future of Data Warehouse
 
Expanding Your Data Warehouse with Tajo
Expanding Your Data Warehouse with TajoExpanding Your Data Warehouse with Tajo
Expanding Your Data Warehouse with Tajo
 
Introduction to Apache Tajo: Data Warehouse for Big Data
Introduction to Apache Tajo: Data Warehouse for Big DataIntroduction to Apache Tajo: Data Warehouse for Big Data
Introduction to Apache Tajo: Data Warehouse for Big Data
 
스타트업사례로 본 로그 데이터분석 : Tajo on AWS
스타트업사례로 본 로그 데이터분석 : Tajo on AWS스타트업사례로 본 로그 데이터분석 : Tajo on AWS
스타트업사례로 본 로그 데이터분석 : Tajo on AWS
 
What's New Tajo 0.10 and Its Beyond
What's New Tajo 0.10 and Its BeyondWhat's New Tajo 0.10 and Its Beyond
What's New Tajo 0.10 and Its Beyond
 
Efficient In­‐situ Processing of Various Storage Types on Apache Tajo
Efficient In­‐situ Processing of Various Storage Types on Apache TajoEfficient In­‐situ Processing of Various Storage Types on Apache Tajo
Efficient In­‐situ Processing of Various Storage Types on Apache Tajo
 
Data analysis with Tajo
Data analysis with TajoData analysis with Tajo
Data analysis with Tajo
 
Gruter TECHDAY 2014 Realtime Processing in Telco
Gruter TECHDAY 2014 Realtime Processing in TelcoGruter TECHDAY 2014 Realtime Processing in Telco
Gruter TECHDAY 2014 Realtime Processing in Telco
 
Gruter_TECHDAY_2014_04_TajoCloudHandsOn (in Korean)
Gruter_TECHDAY_2014_04_TajoCloudHandsOn (in Korean)Gruter_TECHDAY_2014_04_TajoCloudHandsOn (in Korean)
Gruter_TECHDAY_2014_04_TajoCloudHandsOn (in Korean)
 
Gruter_TECHDAY_2014_03_ApacheTajo (in Korean)
Gruter_TECHDAY_2014_03_ApacheTajo (in Korean)Gruter_TECHDAY_2014_03_ApacheTajo (in Korean)
Gruter_TECHDAY_2014_03_ApacheTajo (in Korean)
 
Gruter_TECHDAY_2014_01_SearchEngine (in Korean)
Gruter_TECHDAY_2014_01_SearchEngine (in Korean)Gruter_TECHDAY_2014_01_SearchEngine (in Korean)
Gruter_TECHDAY_2014_01_SearchEngine (in Korean)
 
Apache Tajo - BWC 2014
Apache Tajo - BWC 2014Apache Tajo - BWC 2014
Apache Tajo - BWC 2014
 
Elastic Search Performance Optimization - Deview 2014
Elastic Search Performance Optimization - Deview 2014Elastic Search Performance Optimization - Deview 2014
Elastic Search Performance Optimization - Deview 2014
 
Hadoop security DeView 2014
Hadoop security DeView 2014Hadoop security DeView 2014
Hadoop security DeView 2014
 
Vectorized processing in_a_nutshell_DeView2014
Vectorized processing in_a_nutshell_DeView2014Vectorized processing in_a_nutshell_DeView2014
Vectorized processing in_a_nutshell_DeView2014
 
Big Data Camp LA 2014 - Apache Tajo: A Big Data Warehouse System on Hadoop
Big Data Camp LA 2014 - Apache Tajo: A Big Data Warehouse System on HadoopBig Data Camp LA 2014 - Apache Tajo: A Big Data Warehouse System on Hadoop
Big Data Camp LA 2014 - Apache Tajo: A Big Data Warehouse System on Hadoop
 
Hadoop Summit 2014: Query Optimization and JIT-based Vectorized Execution in ...
Hadoop Summit 2014: Query Optimization and JIT-based Vectorized Execution in ...Hadoop Summit 2014: Query Optimization and JIT-based Vectorized Execution in ...
Hadoop Summit 2014: Query Optimization and JIT-based Vectorized Execution in ...
 
Cloumon sw제품설명회 발표자료
Cloumon sw제품설명회 발표자료Cloumon sw제품설명회 발표자료
Cloumon sw제품설명회 발표자료
 
Tajo case study bay area hug 20131105
Tajo case study bay area hug 20131105Tajo case study bay area hug 20131105
Tajo case study bay area hug 20131105
 

Gruter TECHDAY 2014 MelOn BigData

  • 1. MelOn 빅데이터 도입사례 2014.08 기술개발팀 윤병화PL
  • 2. Profile • 로엔 엔터테인먼트, 멜론사업부 기술개발팀 • MelOn 애플리케이션 아키텍트 • 빅데이터 플랫폼 파트 리더
  • 3. MelOn • 국내 음원 서비스 최대 2천400만 이용자, 320만 음원 보유 • 최다 POC(Point of Customer) 앱 보유
  • 4. MLCP • Music Life Connected Platform • 이해관계자의 참여를 통해 Value가 상호 교환되는 Platform을 구축 Partner Center MelOn AZTalk
  • 5. 팬 소비지수™ 개발 • 이용자들의 31가지 다양한 활동을 점수로 환산하여 아티스트별 팬심을 측정
  • 6. Partner Center • 내 아티스트를 선호하는 팬 대상으로 직접적으로 Target 마케팅 가능 • 더 많은 이용자들이 발견하여 소비를 통한 잠재팬이 될 수 있도록
  • 7. Partner Center 콘텐트 등록 • 아티스트 선호도 데이터를 이용한 Target 마케팅 • 콘텐트 등록 시, 소식 발송 시스템에 전송 수백만 건의 데이터 입력 발생 • 아티스트 X 이용자의 데이터양
  • 9. Partner Center 팬 통계 • 콘텐트 등록에 따른 반응 분석 • 전체 콘텐트에 대해 2014년부터 일, 주, 월간의 통계 제공 • 이용 된 콘텐트 수 X 일 수의 데이터양
  • 11. MelOn
  • 12. MelOn 친밀도 • 아티스트 친밀도를 이용한 재미 • 친구들과의 인기도 공유 • 이용자 X 아티스트 수의 데이터양
  • 13. MelOn 친밀도 히스토리 • 히스토리 분석과 수백억 건의 적재 데이터 • 이용자 X 아티스트 X 항목의 데이터양
  • 14. MelOn 소식 • 아티스트가 등록한 모든 콘텐트가 이용자에게 제공 • 이용자 X 아티스트 소식의 데이터양 (3개월 aging)
  • 15. BIG DATA Volume? • 총 10년간 음원 소비 이력 = 877억건+ • 일 평균 7천만+ 스트리밍 건수 • 월 평균 1,200만+ UV(Unique Visitors) • 아티스트와 이용자 연결? 아티스트 X 이용자 = 43억건+ • 이용자별 아티스트 친밀도 히스토리? 아티스트 X 이용자 X 항목 = 745억+ • 컨텐츠 이용 통계? 320만곡 X 365일 = 10억건+ • 일 2TB+ 데이터 생성. 현재 300TB+ 사용 중 (최소한의 정보만 적재를 원칙으로 하며, 서비스에 따라 Aging 정책 적용 중)
  • 16. MelOn 빅데이터의 현재 • 공존! Hadoop이 잘하는 것과 Netezza가 잘하는 것은 분명 다름 DW 분석계 ~ 2011 서비스 분석계 2012 ~
  • 17. 빅데이터 솔루션 선택 기준 • 분석 관점 • 기존 자바와 오라클을 이용한 배치 애플리케이션의 한계 • 방대한양의 분석 결과 보관 및 재사용 • 다양한 분석 알고리즘 부재 • 서비스 관점 • 방대한양의 분석 결과 적재 가능 • 대량 데이터 온라인 입력, 조회 가능 • 2011년 RDBMS를 이용한 소식 서비스의 부하 경험
  • 18. 빅데이터 솔루션 선택(2011년 하반기 시점) • 오픈 소스 고민 사항 • 내부 인력 부재 • 안정성 불안 • 상용 솔루션 • 고비용 필요 • 알고리즘 개발 필요 • 레퍼런스 부족 • SPADE • 지속적인 기술지원에 대한 의문 • MLCP 발전 따른 추가 개발 요소 필요 • 안정적 대용량 데이터 서비스 • 머신러닝 CF를 이용한 추천 필요 오픈 소스 기반 하둡, HBase, Mahout] 단, 기술 내재화를 가능케 할 파트너 필요
  • 19. MelOn 프로젝트의 키 • 기술 내재화 • 기술을 위해서가 아닌 비즈니스가 우선
  • 20. Hadoop 배포판 • 프로젝트 최초 선택 • 2011년 HA 지원여부에 따른 선택 CDH4 • 현재 Apache Hadoop 2.5, HBase 0.98 MelOn CDH 5.0 (Hadoop 2.3, HBase 0.96)
  • 21. 아키텍처 • 수집  분석  서비스 • 유실 허용에 따른 수집 아키텍처 선택 • 가능한 서비스는 MariaDB로 Bulk 업로드 후 이용 Web App Agent Apps Hudson (배치 수집) MR / Hive / Mahout / Tajo <<분석>> Flume (실시간 수집) HBase / API / 실시간 <<서비스>> Hudson (배치 적재) Sqoop (배치 수집) Oracle MariaDB Netezza
  • 22. 실시간 수집 분석 • Flume 이용 • HDFS 적재 후 실시간 처리 데몬이 처리 • Flume vs Kafka  성숙도, 숙련도, 지원 도구 5분 차트 최근 들은 곡
  • 23. 대용량 누적 적재 • 단순 Summary 하지만 좋은 서비스 • 10년간의 모든 이용자의 데이터 누적 서비스
  • 24. 과유불급 • ROI를 검토를 통한 데이터 적재 최소화 • HBase의 Secondary Index는 큰 비용으로 친밀도 정렬 ROI 검토
  • 25. Win! Win! • 잘하는 것을 항상 이용 함 • 분석은 Hive, 서비스는 MariaDB
  • 26. 특성에 맞는 분석 • Hive vs MapReduce  유지보수성 vs 성능 • Hive + MapReduce(Mahout 포함)  Hybrid
  • 27. 내 것의 소중함 • 하둡 workflow 엔진 Oozie vs Hudson • 관리측면에서 기 사용중인 Hudson 유지 • 2014년 8월 현재 417개 분석/적재 배치
  • 28. 하둡에서 배운 점 • 간단한 연산도 신중히 • 데이터형 변환의 비용 • 실수 연수의 비용 • SimpleDateFormat 등 객체 재사용(온라인 애플리케이션에선 절대 재사용 안함) • 네트워크 사용량 예측 • 클러스터간 데이터 복제 시 내부 네트워크 1g 모두 사용 • 10g로 내부 네트워크 전환 • 복제 시 전송량 제한 • 적당한 부하 • 무리한 워크로드는 장비 고장 유발 • 분석 배치 스케줄 분산 필요 • 하둡 버전 업그레이드는 신중히(CDH 4  5전환) • Hive 내부 처리 변경(예: 수치 계산 ‘NaN’  null) • 서비스에 맞는 튜닝 • 인터넷에는 오래된 가이드 또는 버전 별로 설정 다름 • 최신 하둡 버전은 더 많은 Heap 영역 요구
  • 29. 인프라에서 배운 점 • No저비용 • 제한적인 상면 공간 • 유지보수 업체는 선택이 아닌 필수 • 10g 이더넷, HDD 등 자잘한 추가 비용 • 잦은 H/W 고장 • 분석 시 평균 로드가 70%이상. CPU 팬, 디스크, 컨트롤러, 메모리 등 다양함 • 운영계약이 필수가 되는 요인 • OMC 등의 장애 감지 시스템은 필수(프로세스, 로그, 시스템 상태 등 감시) • 하둡 에코시스템에 특화된 모니터링 도구도 필수 • 주요 분석은 업무시간에 수행 • 제한된 운영 및 관제 인력 • 하둡 이해도의 한계 • 자동화 지원 도구(CMS 등) 필요. 마음은 chef 현실은 rsync • 전문 관제 인력 전무. 매뉴얼 적인 업무 수행 • 인프라 입장의 하둡 플랫폼에 대해 지속적인 학습 필요
  • 30. 개발에서 배운 점 • 하늘의 별 따기 하둡 개발자 모시기 • MelOn 만의 고민은 아님 • 개발자 백업 체계 문제 • 트러블슈팅의 한계 • 내부 스터디 및 전문 회사와 협력 관계 필수 • 프레임워크는 아니어도 공통화는 필수 • 데이터에 대한 시야 • 기획자/개발자 모두 필요 • 도메인 지식 필수, 통계적 마인드 필요. • 사견은 MelOn에 데이터 사이언티스트는 있음. • HBase 특성에 따른 제약 • Contingency Plan 필요에 따른 구현 난이도 향상 (2달간 한번도 발생한 적 없음) • 정렬의 어려움 • 페이징처리의 제한 • 1천만건 이하는 MariaDB 이용
  • 31. 프로세스 • 서비스 기획팀: 데이터 분석 룰 수립 및 결과 검토 • 통계 및 서비스를 위한 룰(공식) 정의 • 분석 데이터 결과 검토 • 기술 개발팀: 개발 및 플랫폼 운영 지원 • 하둡 플랫폼 운영 • 분석 룰 개발 • 서비스 API 개발 그루터 하둡 플랫폼 기술 지원 운영 지원 개발 요건(룰) 전달 및 검토 개발 및 피드백 서비스 기획팀 기술 개발팀
  • 32. 향후 과제: 추천 • 소비가 쉽고, 콘텐트가 많은 MelOn • 웨어러블 디바이스, 스마트카의 등장 • 추천은 반드시 필요 • MelOn이 생각하는 추천 • 메타 기반 추천 • 콘텐트 기반 추천 • 고객 이력 기반 추천 • 결론은 하이브리드와 이용자 컨텍스트에 대한 이해
  • 33. Q & A combine at iloen.com