6. Current Web – Document Web
인간이 이해할 수 있는(human-readable) 웹
• 문서(Document)로 이루어진 글로벌 네트워크
• HTML 문서가 기본 단위
• 인간 가독형 (human-readable) – Presentation
• 문서간 단순 링크 (untyped links)
YES ???
단순 링크로, 연결은 되어 있지만 서로가
어떤 내용을 포함하고 있는지는 모름
참고 : Chris Bizer / The Emerging Web of Linked Data
6
7. Data Web
기계가 이해하고 처리 할 수 있는(machine-readable) 웹
• 데이터(Data)로 이루어진 글로벌 네트워크
• RDF 데이터가 기본 단위
• 기계 가독형 (machine-readable)
• 데이터간 의미있는 링크 (typed links)
YES YES
개체(thing)들 간의 연결로 서로가 개체에
대한 참조 속성으로 연결됨
참고 : Chris Bizer / The Emerging Web of Linked Data
7
8. Data Web Semantic Web : Linked Data
미래의 웹 데이터 웹 Linked Data Global Database
질의, 탐색, 활용
8
9. Linked Data 예시
[residences] Seoul
HongGilDong
http://dbpedia.org/
resource/Seoul
[researches]
[age] SemanticWeb
[name]
[sameAs]
Hong, Gil
35
Dong http://dbpedia.org/
resource/Semantic_Web
http://sws.geonames.org/1835848/
[hasPhotoCollection] [nearbyFeatures]
http://www4.wiwiss.fu-berlin.de/flickrwrappr/
photos/Semantic_Web
http://sws.geonames.org/1835848/nearby.rdf
시맨틱웹은 단지 데이터를 웹으로 제공하는 것이 아니라, 데이터 간의 링크를 만듦으로써, 인간이나 기계 모두 데
이터의 웹을 탐험할 수 있도록 해준다. Linked Data를 통해 유용한 데이터를 얻게 되면, 그 데이터에 관계된 데이
터로 계속되는 항해가 가능하다.
- Tim Berners-Lee, Linked Data, 2006, http://www.w3.org/DesignIssues/LinkedData.html
9
10. Linked Data 4 원칙
1. Use URIs as names for things.
2. Use HTTP URIs so that people can look up those names.
3. When someone looks up a URI, provide useful information, using the
standards. (RDF*, SPARQL)
4. Include links to other URIs. so that they can discover more things.
10
11. Linked Data 4 원칙 – 제 1 원칙
1. Use URIs as names for things.
URI
11
12. Linked Data 4 원칙 – 제 2 원칙
2. Use HTTP URIs so that people can look up those names.
HTTP
12
13. Linked Data 4 원칙 – 제 3 원칙
3. When someone looks up a URI, provide useful information, using the
standards. (RDF*, SPARQL)
RDF
13
14. Linked Data 4 원칙 – 제 3 원칙 (계속)
3. When someone looks up a URI, provide useful information, using the
standards. (RDF*, SPARQL)
SPARQL
14
15. Linked Data 4 원칙 – 제 4 원칙
4. Include links to other URIs. so that they can discover more things.
interlinking
15
16. Linked Data 5 Star
http://lab.linkeddata.deri.ie/2010/star-scheme-
by-example/
16
21. 데이터를 보는 관점
이 데이터는
이렇게 보면 이렇게 쓸
수도 있겠군..
흑 ㅠㅠ 그런데 사용할
수가 없네??
관점
관점
데이터 이 데이터는
주인 이렇게 쓸려고 관점
만들었어
이 2개의 데이터를 섞으
면 내가 원하는 결과를 관점
얻을 수 있는데… 우잉 !!
관점
관점 관점
데이터 이 데이터는
관점
주인 이렇게 쓸려고
만들었어 저 데이터가 있어야 내가
기획한 서비스가 동작하
는데.. 아쉽다..!!!
21
22. 데이터를 보는 관점
내 데이터랑 개방된 웹상의
저 데이터를 융합하면 좋은것
이 나오겠군…!!
내 데이터도 꺼내 놓으라고?? 그건 안돼 !!
왜냐고??
음 !!!
품질도 안 좋고…
데이터
비밀스러운 데이터이고…
주인
누가 볼까 걱정되고..
우리 서버 느려질테고…
등등
이유는 백만가지도 넘어..
난 그냥 누가 꺼내 놓으면 그걸 가져다가만
쓸꺼야…!!!
23. 데이터를 보는 관점
데이터 좀 쓰기 좋게 오픈해 주심 안돼요?
안됩니다. 비밀 데이터입니다.
홈페이지에 다 있던데요?? 그런데 HTML 포맷이라 쓰기가 불편해요..
헉..그래요?? 음…그건 오픈하면 안되는거라 막아야 합니다..조치하겠습니다.
앗..우잉…그럼 그거라도 그냥 쓸께요…막지는 마세요..ㅠㅠ
데이터
주인
25. Vocabulary - SKOS
• 시소러스, 택사노미, 분류체계와 주제명표목 같은 지식어휘체계를 웹에 표현하기 위한 RDF 용어집(vocabulary)
• Enterprise 환경의 표준 용어 관리나, Linked Data 서비스에서 개체들을 표현하기 위한 용어들간의 관계 표현에 주로
활용
• 미국 의회도서관의 LCSH 등과 함께 Linked Data를 위한 거의 모든 RDF에서 활용되고 있음
• W3C는 Linked Data 데이터 셋에서 용어간의 관계 표현과 함께 기존의 택사노미, 시소러스, 분류체계 등을 Linked
Data로 발행하고자 할 경우 SKOS를 사용할 것을 권고하고 있음
DBpedia에서의 SKOS 활용 예시
SKOS로 표현된 World Wide Web
25
26. Vocabulary - FOAF
• 사람간의 관계 기술을 위한 RDF 기반의 명세 용어집(vocabulary)
• RDF 구문을 기반으로 하고 있으며, 그룹(group)에 소속되어 있는 개인(person), 조직(organization)에 의해 생성된 문서
(document), 한 개인과 연결된 다른 개인의 연결 등의 처리에 활용
• FOAF-a-matic 과 같은 간단한 어플리케이션을 통해 누구라도 손쉽게 자신의 FOAF를 만들 수 있음
FOAF를 이용한 Social Network의 통합
(Sheila Kinsella, Applications of Social Network Analysis 2007)
26
27. Vocabulary - SIOC
• 시맨틱웹 기술을 이용하여 SNS 등의 커뮤니티를 연결하고자 하는 목적의 RDF 기반 용어집(vocabulary)
• 2004년 DERI를 중심으로 시작된 온라인 커뮤니티를 의미적으로 연결하기 위한 시도 중 하나로, 커뮤니티 사이의 관계
를 표현하기 위해 RDF/RDFS를 이용하는 SIOC 온톨로지를 사용하며 FOAF, RSS 등을 이용해 확장 가능하도록 하고
있음
SIOC의 주요 클래스와 속성
27
28. Vocabulary - Dublin Core
• 기본적인 메타데이터의 속성을 표현하기 위한 용어집
• 동영상, 소리, 이미지, 텍스트, 웹 페이지 등의 디지털 매체들을 기술하는 데 널리 사용되며, XML과 RDF를 사용하여 구
현되어 있음
• 데이터의 형식과 구조를 단순화하여 원문의 저자나 발행자가 메타데이터를 직접 작성하고, 이를 바탕으로 특정분야에
서 요구되는 수준으로 확장하여 사용할 수 있도록 하는 것이 Dublin Core의 목적
Drupal에서의 Dublin Core 예시 Dublin Core 메타데이터 요소
28
30. 미국 의회 도서관
• 도서관 자료의 주제목록(subject cataloging)을 위한 Subject Headings를 Linked Data로 발행
• MARC21(MARCXML)포맷으로 되어 있는 전거 데이터(authority record)를 RDF 포맷의 SKOS를 이용하여 RDF화
• 전거 레코드의 각 항목(entry)을 skos:Concept의 인스턴스로 대응하고 LCCN(Library Congress Control Number)을 이
용하여 URI 부여
http://lcsubjects.org/subjects/sh95000541
LCSH에서 MARC와 SKOS의 매핑 관계 World Wide Web을 표현한 Linked Data
30
31. VIAF
VIAF(Virtual International Authority File)
• 목적
- 전거 데이터의 공유 증진
- 목록 비용 절감
- 국제적인 전거 통제
• Linked Data의 활용
- 항목마다 URI를 부여하여 linked data로 이용 가능
- UNIMARC과 MARC21, RDF 지원
VIAF에서의 Steve Jobs
http://viaf.org/viaf/84237107/#Jobs,_Steve,_1955-2011
VIAF에서 지원하는
동일 개체의 표현 방법
31
32. LIBRIS
• 스웨덴 국립도서관으로 도서관 전체 데이터를 Linked Data로 구축한 최초의 종합목록(2008년)
• 대학도서관 및 연구도서관, 박물관, 아카이브, 공공도서관 등 170여개 도서관 기관이 이용하는 종합목록시스템.
• RDF파일 포맷을 제공하여 Linked Data를 구현.
• ―아래는 Linked data : evolving the web into a global data space / Tom Heath, Christian Bizer‖ 예시
http://libris.kb.se/bib/12130810 http://libris.kb.se/data/bib/12130810
32
33. data.gov.uk
• 영국 정부는 정책의 투명성을 높이고, 국민의 알 권리를 향상시키며, 공공정보의 재사용성 증진을 통해 경제적 사회적
가치 증대를 유발시키고자 공공 정보 개방
• 차세대 웹(web of data, 즉, Semantic Web)기술에서 자국의 인지도를 상승시키고, 데이터를 보다 윤택하게 제공하기
위해 Linked Data 기술 적용
33
35. BBC
• BBC의 대표적 Linked Data 서비스인 BBC Music과 BBC Worldcup
BBC Music BBC Worldcup
35
36. Linked Data 기술 : 기술 개념도
Mashup Browsing Search …
6. Linked Data 서비스 구현
1. 온톨로지 설계
4. 온톨로지(트리플) 관리
5. 추론
저장
온톨로지 개념 모델
변환 규칙 (온톨로지)
3. 온톨로지(트리플) 변환
ERP DW CRM
… 2. 온톨로지(트리플) 변환 매핑 설계
36
37. Linked Data 솔루션
• 기존의 온톨로지 레파지토리 시스템 중심의
OpenLink 통합 솔루션
• 다양한 RDBMS, ODBMS, File Server의 데이터
뿐만 아니라 텍스트, XML, HTML 데이터를 하나
로 통합하는 미들웨어
• DBPedia, MusicBrainz, Bio2RDF 등의 Linked
Data 프로젝트에 활용
• 현재 세계에서 가장 주목 받고 있는 Linked Data
솔루션 중의 하나
• 영국 Talis사의 통합 솔루션
• 영국의 data.gov.uk, ordnancesurvey와 BBC
Music 서비스 구축에 도입
• 구조적, 비구조적 데이터의 RDF 변환 기능 제공
• SPARQL Endpoint 등의 Cloud 기반 Linked Data
호스팅 서비스 기능 제공
• 영국의 data.gov.uk 등과 함께 현재 세계에서 가
장 주목 받고 있는 Linked Data 솔루션 중의 하나
37
38. Linked Data 솔루션
• 독일 Ontotext사의 LDSR(Linked Data Semantic
Repository)
• LOD 데이터 셋 중 생명공학 분야데이터 셋 40억
개의 Linked Data 서비스를 제공하는
linkedlifedata 서비스 구축에 도입
• 오픈소스 Sesame 구조 위에 SAIL 추론 계층 등
을 두어 솔루션 제공
• 추론 지원정도나 대용량 지원 정도에 따라
OWLIM-Lite, OWLIM-SE, OWLIM-Enterprise로
구분
• D2R Server는 베를린 대학의 오픈소스 프로젝트
로 주로 Linked Data의 허브 역할을 하는 것으로
다양한 원천 데이터로 부터 트리플을 생성, 변환
해주는 기능 제공 – DBPedia, BBC Worldcup 등
에서 활용
• AllegroGraph는 미국 Franz사의 Linked Data 구
축을 지원하는 대용량 트리플 스토어
• OntoBase2.0은 한국 탑쿼드란트코리아의
Linked Data 서비스 구축에 최적화된 대용량 트
리플 스토어
38
40. thedatahub
The Comprehensive Knowledge Archive Network
40
41. Why semantic web for Cultural Heritage
• Many C.H. institutions have a data integration problem, since data about
the same artifacts is scattered in separate silos:
– cataloging data
– acquisition data
– conservation data
– scientific data, …
41
42. Why semantic web for Cultural Heritage
• Global 환경의 데이터 활용 – Giant Global Graph
42
43. Cultural Heritage Data Standards
• Dublin Core (DC)
– Simple resource descriptions: author, date created, etc
– ISO 15836
• Conceptual Reference Model (CRM)
– 국제박물관협의회(ICOM-International Council of Museums)의 국제문서화위원회(CIDOC-
International Committee on Documentation)가 이질적인 문화유산 정보의 통합, 교환, 연결 하
기 위해 만든 온톨로지
– ISO 21127 (2006) "Information and documentation — A reference ontology for the
interchange of cultural heritage information"
• Functional Requirements for Bibliographic Records (FRBR)
– by International Federation of Library Associations and Institutions(IFLA) - 국제도서관협회연
맹
– Conceptual entity-relationship model
• Europeana Data Model (EDM)
– Structuring the data that Europeana is ingesting, managing and publishing
– Refined until the end of 2010, will be implemented during 2011
– Open, cross-domain framework, adheres to Semantic Web modeling principles
43
44. MOLTO
• Requirements:
- the ability to handle generic knowledge, such as people, institutions, and locations
- the ability to handle specific subject domains, such as the cultural heritage and
museums
• Ontology & Interlinking
- DBpedia - the RDF-ized version of Wikipedia, describing more than 3.5 million
things and covers 97 languages.
- Geonames - a geographic database that covers 6 million of the most significant
geographical features on Earth.
- PROTON - an light weight upper-level ontology, 542 entity classes and 183
properties. PROTON is encoded in OWL Lite
- CIDOC-CRM
- Painting Ontology (Time Ontology, Mid-Level-Ontology SUMO)
- Linkages to DBpedia
• http://www.molto-project.eu
44
46. MOLTO – Gothenburg City Museum Data
• 8,900 museum objects in two museum collections
- GSM(Gothenburg Stads Museum) and GIM(Gothenburg Industry Museum)
• 39 properties describe each museum object
MAO – Finland
http://www.seco.tkk.fi/projects/finnonto/
46
53. Europeana
• http://europeana.eu
• Pan-European Digital Museum
• People can explore the digital resources of Europe's
museums, libraries, archives, audio-visual collections
• And be inspired by the rich diversity of Europe's cultural and
scientific heritage
• Promotes discovery and networking opportunities in a
multilingual space
• Around 1500 institutions contributed
– Includes over 15 M items
53
54. Europeana and Semantic Web
• Europeana adopts semantic web for all future development
– EDM is based on semweb, which makes it easily extensible
– Current holdings will be converted to semweb format
• Europeana's first White Paper Knowledge = Information in Context looks at the key
role LOD will play in Europeana's development
– "Linked data gives machines the ability to make associations and put search terms into
context. Without linked data, Europeana could be seen as a simple collection of digital objects.
With linked data, the potential is far greater"
• LOD Experiment in Europeana Thought Lab:
– Data and metadata from the Amsterdam Museum (AM)
• 70k cultural heritage objects related to the city
– Retrieved from an XML API of the museum's collection (database by AdLib UK)
– Converted to LOD compliant with EDM by Vrije Universiteit (VU): 5M facts
• Conversion software is available as open source
– Linked to existing datasets
• Dutch Art and Architecture Thesaurus (AATNed)
• Getty's Union List of Artists Names (ULAN)
• DBpedia (data version of Wikipedia)
• GeoNames (structured geographical data)
– Published to the Comprehensive Knowledge Archives Network (CKAN)
– Prime example the type of LOD that Europeana will be producing
54
55. Europeana – Technical Architecture
The Europeana Semantic elements The Europeana Data Models
55
60. Linked Heritage
• Coordination of Standards and Technologies for the enrichment of Europeana
- www.linkedheritage.org
- Linked Heritage is a 30 month EU project, started on 1st April 2011
• 38 partners from 24 countries and 4 external contributors
• Contribution of content Europeana: 3 millions objects
• 5 key areas of development and innovation:
- Linked Data
- Persistent identifiers
- Metadata and standards
- Cooperation with the private sector
- Multilingual and cross-domain combination of terminologies
60