5. 공공정보 활용 사업화 전략 세미나 - 대전
5
쌍떡잎식물 장미목 장미과 낙엽교목 식물인 사과나무의 열매.
[출처] 사과 | 두산백과
붉은 색에 둥근 모양을 갖고 있고 움푹 들어간 꼭지를 가지고 있는
과일
색 모양 분류
누군가 사과를 바라보는 시각
6. 공공정보 활용 사업화 전략 세미나 - 대전
6
도서관 데이터(Library Data)
• 표제/책임표시사항: 철학이 필요한 시간 : 강신주
의 인문학 카운슬링 / 강신주 지음
• 발행사항 파주 : 사계절출판사, 2011
• 형태사항 346 p. :천연색삽화 ;23 cm
• 표준번호/부호 ISBN: 978-89-5828-534-2 03100
• 분류기호: 한국십진분류법-> 104 한국십진분류
법-> 001.3 듀이십진분류법-> 102 듀이십진
분류법-> 001.3
• 주제명: 철학 에세이[哲學--] 인문 과학[人文科學]
7. 공공정보 활용 사업화 전략 세미나 - 대전
7
• 표제/책임표시사항: 철학이 필요한 시간 : 강신주의 인문학 카운슬링 / 강신주 지음
• 발행사항 파주 : 사계절출판사, 2011
• 형태사항 346 p. :천연색삽화 ;23 cm
• 표준번호/부호 ISBN: 978-89-5828-534-2 03100
• 분류기호: 한국십진분류법-> 104 한국십진분류법-> 001.3 듀이십진분류법->
102 듀이십진분류법-> 001.3
• 주제명: 철학 에세이[哲學--] 인문 과학[人文科學]
서지 정보/데이터
저자명 정보/데이터
주제명 정보/데이터
도서관 데이터(Library Data)는
8. 공공정보 활용 사업화 전략 세미나 - 대전
8
서지 정보/데이터 저자명 정보/데이터주제명 정보/데이터
객체,
서브젝트,
개념
도서관 데이터(Library Data)를 공공정보로 개방한다는 것은
속성
제목
저자
출판사
발행년
용어
상위어
하위어
이름
생몰년
연락처
특정 객체, 개념과 속성과 속성이 갖는 값(강신주, 철학)을
누구나 이해할 수 있는 형태로 공개해서 활용할 수 있도록 해주는 것
11. 공공정보 활용 사업화 전략 세미나 - 대전
11
Check Point1. 여러분 입장에서 공공정보를 개방하고 있다는 곳에서
• 어떤 객체, 개념을 가지고 있는 지 알 수 있는가?
• 그 객체, 개념을 어떤 속성으로 관리하고 개방하고 있는지 알 수
있는가?
• 개방하고 있는 정보가 정말 가지고 있는 모든 것인가?
• 범용적인, 혹은 내가 놀고 있는 플랫폼에서 활용 가능한가?(표준)
• 나도 (개발능력이 없는) 활용할 수 있는 플랫폼인가?
• 나에게 어떤 노력을 기울이고 있는가?
13. 공공정보 활용 사업화 전략 세미나 - 대전
13
공공정보로서 서지정보의 가치
인류의 지식
문자의 역사
인류의 기록
14. 공공정보 활용 사업화 전략 세미나 - 대전
14
현재까지 국립중앙도서관의 데이터 공개
MARC, OAI, Open API
15. 공공정보 활용 사업화 전략 세미나 - 대전
15
국가서지기반 데이터 플랫폼 구축
• 문서 중심의 현재 웹 생태계에 RDF기반의 데이터 플랫폼을 구축
하고 사람들이 활용할 수 있도록 하는 활동
• 데이터 변환 : MARC2RDF
• 데이터 플랫폼 구축 : 데이터 검색, 다운로드 등
• 데이터 활용 교육(Data Literacy) 및 해커톤
16. 공공정보 활용 사업화 전략 세미나 - 대전
16
"The Semantic Web is an extensionof the current web in which
information is given well-defined meaning, better enabling
computers and people to work in cooperation."
Tim Berners-Lee, James Hendler, Ora Lassila, The Semantic Web, Scientific American, May 2001
17.
18. 공공정보 활용 사업화 전략 세미나 - 대전
18
[출처 : http://www.slideshare.net/sandhaus/all-about-rnews-evan-sandhaus]
structured
unstructured
28. 공공정보 활용 사업화 전략 세미나 - 대전
28
도서관 데이터 플랫폼 구축의 특징
• 개념적 접근과 기술적 접근이 동시에 진행
• 개념적 접근 = FRBR, RDA, BIBFRAME
• 단순히 가지고 있는 데이터를 표준언어, 프로토콜에 맞추어
개방하는 것이 아니라 ‘책’ ‘서지’라는 객체가 갖는 데이터모
델로 접근
32. 공공정보 활용 사업화 전략 세미나 - 대전
32
ISNI
ISNI
ISNI
ISNI
ISBN
ISAN
ISRC
created-by/creates
ISTC
Role: Creator/Author
Role: Adaptor
Role: Performer
Role: Contributor
written-by
performed-by
performed-by
adapted-by/adapts
performed-by/performs
contributed-by/contributes
abstraction-of/manifestation
contained-in/contains
abstraction-of/performance
핵심연구과제 : URI정합성 연구
33. 공공정보 활용 사업화 전략 세미나 - 대전
33
ISNI
ISAN
ISWC
ISRCISTC
ISBN
ISSN IPI
IDA
CSI
ISAN
IPI
VIAF IPDA
핵심연구과제 : URI정합성 연구
34. 공공정보 활용 사업화 전략 세미나 - 대전
34
국립중앙도서관 데이터 플랫폼 구축의 기본 원칙
• Open이 먼저
• 국립도서관의 데이터는 기본적으로 누구나 자유롭게 활용할 수 있
는
공공데이터(Public Data)
• 어떤 형태, 방식으로든 Open
• Open하되 되도록이면 개방형 표준을 활용
• Linked Data Principle 준수
• Information Ecosystem에 기여
• Web은 가장 보편화되고 일반적인 Platform이자 Ecosystem
• Linked data로 얻는 이득보다 글로벌 데이터베이스(Web) 세계에
기여한다는 마음이 우선
• 개방으로 직접적으로 얻을 수 있는 이득 보다 우리의 데이터가 살아
서 누군가에게 새로운 “가능성”을 열어 줄 수 있음을 우선 고려
35. 공공정보 활용 사업화 전략 세미나 - 대전
35
국립중앙도서관 데이터 플랫폼 구축의 기본 원칙
• 이용자를 생산자로
• 단순한 데이터의 개방과 서비스를 넘어, 데이터를 만들고 자유롭게
활용할 수 있는 Data Literacy 교육
• 도서관 데이터의 시각화가 아니라 ‘이용자’가 갖고 있는 데이터의
조합과 시각화
36. 공공정보 활용 사업화 전략 세미나 - 대전
36
국립중앙도서관 Data Platform
서지 MARC
저자명 전거 MARC
주제명 DB
디지털서지(XML) 기타(웹 등)
구조화된 데이터 비구조화 데이터
RDB API RDF filesRDF Store
국립중앙도서관 데이터 플랫폼
37. 공공정보 활용 사업화 전략 세미나 - 대전
37
국립중앙도서관 Data Platform
MARC OAI
Open
API
RDF OData JASON XML
FOAF, FRBR, SKOS, SIOC, DC, MODS, PREMIS,
BibFrame, EDM…
국립중앙도서관 데이터 플랫폼
• 원하는 데이터를 원하는 형태로, 원하는 Vocabulary/Data Model
로 활용할 수 있도록
38. 공공정보 활용 사업화 전략 세미나 - 대전
38
http://www.viewshare.org
국립중앙도서관 데이터 플랫폼
39. 공공정보 활용 사업화 전략 세미나 - 대전
39
1
2
3
4
국립중앙도서관 데이터 플랫폼
40. 공공정보 활용 사업화 전략 세미나 - 대전
40
조합? Mash-Up?
내 Data
Know-What
Know-How
Know-Where
Know-Why
Know-Who
Know-When
+ ?
41. 공공정보 활용 사업화 전략 세미나 - 대전
41
조합? Mash-Up?
Context
42. 공공정보 활용 사업화 전략 세미나 - 대전
42
내가 활용하고 싶은 객체의 속성은 무엇인가?
내가 표현하고 싶은 객체의 속성은 무엇인가?
다른 사람들은 어떻게 부르고 어떻게 표현하는가?
43. 공공정보 활용 사업화 전략 세미나 - 대전
43
내가 활용하고 싶은 객체의 속성은 무엇인가?
내가 표현하고 싶은 객체의 속성은 무엇인가?
다른 사람들은 어떻게 부르고 어떻게 표현하는가?
44. 공공정보 활용 사업화 전략 세미나 - 대전
44
Check Point2. 시맨틱 웹 공공정보 활용에 대한 정확한 시선 필요
• 개방된 공공정보를 활용하면
• 누구나 ‘서울버스’ 앱을 만들 수 있다?
• 1인 기업, 수익창출 소위 대박의 주인공이 될 수 있다?
• 개방만 되면 당장 새로운 세상이 열릴 것이다?
• 데이터 서비스 플랫폼에서 누구나 유익한 정보를 얻을 수 있다?
• ‘내’가 주인공이 되는 정보 세상이 열릴 것이다?
45. 공공정보 활용 사업화 전략 세미나 - 대전
45
서지정보의 미래 : 구조화된 데이터
• 국립도서관의 중요한 역할
• 국립도서관은 정보를 영구보존 합니다.
책, 전자책, CD, DVD, Web Site, Digital File
이 전자책의 제목은, 저자는, 출판년도는, 출판사는, 주제분야는..
어떤 SW로 만들어졌고, 어떤 OS에서 돌아가고, 그 SW의
업데이트는 언제 이루어졌고...
어디에 위치해있고, 현재 상태는 어떠하고...
46. 공공정보 활용 사업화 전략 세미나 - 대전
46
서지정보의 미래 : 구조화된 데이터
• 도서관이 바라보는 전자책
정보객체
(Information Object)
Epub 해석규
칙
(Epub Reader)
001011100
000111101
111110110
101010110
표현정보 데이터 객체
47. 공공정보 활용 사업화 전략 세미나 - 대전
47
서지정보의 미래 : 구조화된 데이터
• Epub, Microsoft 2007이상
• 구조화된 형태로(XML) 표준 메타데이터를 활용(DublinCore 등)하여
플랫폼, 애플리케이션 독립적으로 활용이 가능한 디지털 정보 객체
48. 공공정보 활용 사업화 전략 세미나 - 대전
48
참고자료
• http://www.flickr.com/photos/taylorsloan/5539665800
• http://www.flickr.com/photos/shareconference/5422273956
• http://www.flickr.com/photos/eole/2349202525
• http://www.flickr.com/photos/gingerkitty/906756839
• http://www.flickr.com/photos/charlestilford/2552654321/
• http://www.flickr.com/photos/robgallop/514764284
• http://www.parentsociety.com/parenting/7-things-parents-say-youll-say-them-too/
이미지 출처
박진호, jino.kor@gmail.com
• Kevin Ford, LC’s Bibliographic Framework Initiative: An Update
http://3windmills.com/kefo-swib12-bfi/kefo-swib12.pdf
• Sam Oh. 2011. Invited Speech - ISO/TC46 & ISO/IEC JTC1/SC34.
『 LaRC 2011』, June 10-11, 2011. [Seoul, Korea : Seoul Olympic Parktel]
www.istandard.or.kr/_custom/ksa/download.jsp?file_id=16779
• 박진호. ISO Identifier & UCI. 『국가디지털콘텐츠식별체계(UCI) 세미나 및
활용전략 발표회』, 2012.10.31. [서울, 한국저작권위원회]