1. 웹보메트릭스와 계량정보학
1주차 정보의 속성과 본질에 대한 개괄
1강. 정보의 정의 및 구성요소
2강. 빅데이터란?
영남대학교 문과대학 언론정보학과
교수 박한우
2. 1. 정보의 속성과 본질에 대해 이해한다.
1. 빅데이터란?
2. 급부상하는 빅데이터
3. 각 국가별 빅데이터 연구 현황
4. 빅데이터 활용의 필요성
5. 빅데이터를 활용한 국내사례
6. 빅데이터를 활용한 해외사례
7. 빅데이터의 현안 및 쟁점
3. 1. 빅데이터(big data)란?
빅데이터(big data)
기존 데이터베이스 관리도구로 데이터를 수집, 저장, 관리
분석할 수 있는 역량을 넘어서는 대량의 정형 또는 비정형
데이터 집합 및 이러한 데이터로부터 가치를 추출하고
결과를 분석하는 기술을 의미
4. 2. 급부상하는 빅데이터
“
4대 기술-빅데이터, 소비자 3D
프린터, 게임화(Gamification), 입는 이용자 인터페이스는 과도한
기대수준의 정상에 위치한다.
“Hype Cycle for Emerging Technologies 2013”, Gartner(2013)
”
3가지 측면의 해석
첫째, 빅데이터가
일상생활과
산업영역을 모두
지배할 것이라는
순진한 전망을
경계해야 함.
둘째, 선진국과
세계를 선도하는
기업들은
빅데이터의 무한한
가능성을 현실로
만들어 경제 성장을
도모하고 있다는 것
셋째, 5-10년 내에
빅데이터 SOC를
구축하지 못한다면
빅데이터와 매개된
다른 분야를 성공적
혁신으로
이끌어내지
못한다는 것.
6. 2. 급부상하는 빅데이터
예측분석학
(Predictive Analytics)
위치지능학
(Location Intelligence)
전망
2년 내에, 클라우드 컴퓨팅(Cloud Computing)과 SNS 활동
유수(Activity Streams) 기술은 그 기능적 혁신이 대부분 완료되고
대중적 확산과 생산의 안정기(Plateau of Productivity)에 도달할 것.
중요한 점
이러한 기술들은 홀로 존재하는 것이 아니라 빅데이터 환경을 통한
상호작용, 나아가 빅데이터 기반 위에서 원활하게 작동하는 것임.
7. 2. 급부상하는 빅데이터
출처: Halevi, G., & Moed, H. F. (2012).
<연도별 빅데이터 관련 논문의 증가>
G. Halevi와 H.,F. Mode가 2012년 9월에 발표한 자료는 흥미로운 결과를 제공함.
그들은 학술DB인 Scopus에서 „빅데이터‟를 검색어로 사용하여 관련분야의
연구동향을 조사하였음. 총 306건의 논문을 분석한 결과 빅데이터 연구는
1970년부터 시작되어 2008년부터 눈에 띄는 급격한 증가를 보임.
8. 2. 급부상하는 빅데이터
출처: Halevi, G., & Moed, H. F. (2012).
<1999-2005년에 발행된 논문들의 의미네트워크>
1999-2005년에 발행된 논문들의 의미네트워크를 살펴보면 „데이터‟가 중앙에 위치하고
„빅‟ „데이터마이닝‟ „XML‟이 핵심어로 출현. 주변에는 „신경망‟ „인공지능‟ „네트워크‟가
중심부에 포함되지 못한 채 외곽에 위치.
9. 2. 급부상하는 빅데이터
출처: Halevi, G., & Moed, H. F. (2012).
<2006-2012년에 발행된 논문들의 의미네트워크>
2006-2012년에 발행된 논문들의 관련 단어들은 대부분이 연결. 특히 „소셜‟ „분석‟
„이용자‟ „클라우드‟가 „데이터‟의 이웃에 출현하여 핵심그룹을 형성한 것이 인상적.
10. 3. 각 국가별 빅데이터 연구 현황
미국, 중국, 독일이 연구를 선도하고 있음.
출처: Rousseau(2012)
11. 4. 빅데이터 활용의 필요성
빅데이터 활용의 필요성
• 빅데이터는 미래 경쟁력의 원천으로 관심이 증가하는 추세
• 빅데이터는 과거, 현재, 미래 분석 및 예측 등에 활용
• 공공데이터 공개(빅데이터)로 인한 민간 사업 활용을 촉진
• 빅데이터를 활용한 과학적 행정 구현이 가능
• 빅데이터를 활용한 수혜자 맞춤형 서비스 제공 가능
12. 5. 빅데이터를 활용한 국내 사례
빅데이터를 이용한 심야버스 노선 구축
지하철 3호선 개통에 따른 버스노선 구축
지도 데이터와 고객의 데이터를 결합해
지도 위에서 고객의 거래 내용을
실시간으로 볼 수 있는 시스템을
개발하여 마케팅에 활용예정
13. 6. 빅데이터를 활용한 해외 사례
미국 소비지출 예측
포드(Ford)
미국
소비자태도지수 설문조사보다 구글 트랜드를
활용한 결과가 더 정확
차량에 설치된 센서로 고객의 운전습관 등의 데이터를 분
석해 소비자 니즈 파악
공공 빅데이터를 이용해 기상상황을 분석 다양한 정보를 제공
해커톤 프로젝트
빅데이터로 발굴한 새로운 기사들
14. 6. 빅데이터를 활용한 해외 사례
공공데이터 개방의 각종 사례
미국
data.gov / 연방정부 차원의
범정부기관의 데이터를 통합
저장 및 제공
영국
data.gov.uk / 내각부 총리실 등
698개 기관을 포함한 6천개의
정부 공공기관의 데이터 세트에
접근할 수 있는 단일 창구 /
OGL(Open Government Licence)
오스트레일리아
data.australia.gov.au / 정보의
접근 용이성 향상, 중앙 및 지역
공공기관의 데이터 재생산과
활용을 위해 공공정보 제공
뉴질랜드
data.govt.nz / 공공정보의 접근성
확대와 재활용을 통한 경제적
부가가치 창출을 위해 공공 정보
공개 포털로 구축 및 운영
15. 7. 빅데이터의 현안 및 쟁점
가. 빅데이터 격차
최근 IDC(2012)의 보고서에 따르면, 2012년 현재 디지털 데이터의 총 분량은 약 543
엑사바이트로 추정.
그 가운데 단지 23퍼센트만이 유용함. 전제조건은 23퍼센트의 데이터의 내용이
무엇인지 태그되고 분석되어야 함.
잠재적으로 유용한 데이터의 3%만이 태그 정보가 있으며 실제 분석되는 정보는 훨씬
더 적음.
<2012년 활용화되지 못한 빅데이터 격차>
http://www.emc.com/leadership/digital-universe/iview/images/untapped-big-data-gap-lg.jpg
16. 7. 빅데이터의 현안 및 쟁점
나. 정부 공공데이터 뿐 아니라 민간 데이터의 융합 필요성
다. 트리플헬릭스 관점의 연계 필요
라. 빅데이터 저장 및 관리의 일관성, 공유와 보안 대책 필요
마. 빅데이터 운영 및 분석 기술 필요
17. QUIZ.
기존 데이터베이스 관리도구로 데이터를 수집, 저장, 관리 분석할 수
있는 역량을 넘어서는 대량의 정형 또는 비정형 데이터 집합 및 이러한
데이터로부터 가치를 추출하고 결과를 분석하는 기술을 의미하는 것은?
빅데이터
18. 정리하기.
빅데이터(big data)는 기존 데이터베이스 관리도구로 데이터를 수집,
저장, 관리 분석할 수 있는 역량을 넘어서는 대량의 정형 또는 비정형
데이터 집합 및 이러한 데이터로부터 가치를 추출하고 결과를
분석하는 기술을 의미한다.
빅데이터는 미래 경쟁력의 원천으로 관심이 증가하는 추세에 있으며,
빅데이터 연구가 활성화 되기 위해서는 정부 공공데이터 뿐 아니라
민간 데이터의 융합 및 트리플헬릭스 관점의 연계 , 빅데이터 저장 및
관리의 일관성, 공유와 보안 대책을 마련하는 등 빅데이터 운영 및
분석 기술이 필요하다.
19. 참고문헌.
• 박한우 - 창조경제 정부 3.0 플랫폼 (http://www.slideshare.net/hanpark/3028145862)
http://hanpark.net
• 임상곤(1995), 정보분석론, 백산출판사.
• Schofield, J. (2013, 8. 19). Garner's 2013 Emerging Technologies
hype cycle focuses on humans and machines.
http://www.zdnet.com/gartners-2013-emerging-technologies-hype-cyclefocuses-on-humans-and-machines-7000019564/
• Garner(2013). Hype Cycle for Emerging Technologies,
http://www.gartner.com/technology/research/hype-cycles/
• IDC(2012), The Digital Universe in 2020: Big Data, Bigger Digital
Shadows, and Biggest Growth in the Far East.
http://www.emc.com/leadership/digital-universe/iview/big-data-2020.htm
• Van Dijk(2012), Network society, SAGE.