A future that integrates LLMs and LAMs (Symposium)
서울시 링크드 데이터 서비스 사례 소개-모델링
1. 서울시 Linked Data 서비스 사례 소개
오픈 데이터에서 링크드 데이터로 진화
Open Knowledge Foundation Korea, 2013
2. 구축 범위
Modeling
- 서울시 열린데이터광장 데이터 중 시범과제에 적합한 데이터셋 선정 ( 문화시설
- 추가로 문화재청 데이터와 행정구역 모델링
문화재
( 문화재
청 )
문화재
( 문화재
청 )
문화시설
( 열린데
이터광
장 )
문화시설
( 열린데
이터광
장 )
행정구역행정구역
3. 모델링 주안점 ( 방향 )
Modeling
3
표현력 보다는 기존 데이터의 연결을 통한 Linked Data
구성
기존 Vocabulary 의 재사용을 통한 모델링
- dc, dcterm, foaf, sioc, schem.org 등
11
22
33
44
외부 데이터셋과의 연결성 강화 (dbpedia)
- 구축된 데이터의 silo 경계
영어권에서도 활용 가능한 영문 레이블 동시 제공
4. 구축절차
Modeling
데이터셋 선정
4
11
* 서울시 열린데이터 광장에서 모델링 대상 데이터셋 선정 ( 문화시설 )
* 문화재청 , 행정구역 모델링 추가
데이터셋 항목 검토 및 매핑22
* 데이터셋의 개별 항목과 온톨로지 ( 클래스 , 속성 ) 의 매핑 관계 검토
* 외부 어휘의 재사용 여부 및 범위 결정
* 어휘와 데이터셋 항목 매핑
URI 체계 결정 및 온톨로지 설계 완료33
* 클래스 , 속성 , 인스턴스 URI 체계 결정
* 온톨로지 모델링
6. 문화시설 – 1. Raw Data
Modeling
6
필드명 필드설명 사용여부
id 일련번호 X
facility_code 문화시설코드 ?
management_code 관리번호 X
subject_code 주제분류코드 X
theme_code 테마분류코드 X
facility_name 문화시설명 O
region1 시도 O
region2 군구 O
region3 읍면동 O
san_yn 산지여부 O
bon_yn 산지여부 O
bu_yn 산지여부 O
main_img 대표이미지 O
address 주소 O
phone 전화번호 O
fax 팩스번호 O
homepage 홈페이지 O
open_hour 관람시간 O
enter_fee 관람료 O
close_day 휴관일 O
open_day 개관일자 O
seat_cnt 객석수 O
x_coord x좌표 O
y_coord y좌표 O
etc_desc 기타사항 O
facility_desc 시설소개 O
enter_free 무료구분 X
x_wgs84 위도 O
y_wgs84 경도 O
facility_name_eng 영문명 O
address_eng 영문주소(Full) O
zipcode 우편번호 O
serial 시리얼 X
address_kor 주소(시/구/동) O
address_eng2 영문주소2 O
10. 문화시설 – 4. 클래스 , 속성 모델링 진행
Modeling
문화시설 초기 클래스 구조
11. 문화시설 – 5. schema.org 재사용 상의 이슈
Modeling
schema.org 클래스 구조
12. 문화시설 – 5. schema.org 재사용 상의 이슈
Modeling
Another Type System 사용
Place
CivicStructure
Musieum
국립중앙박물관
type
장소
이름
구청
문화예술회관
구민회관
영화관
박물관
갤러리
기념관
전시관
궁
국악원
문화원
수련관
type
전시시설
박물관 기념관 갤러리
type 열거형 타입 시스템
계층형 타입 시스템
Schema.org 클래스
13. 문화시설 – 6. 모델링을 위한 공유 Template
Modeling
( 최종본 아님 )
17. 17
data.seoul.go.kr
필드명 필드설명 사용여부 비고
id 아이디 변경됨(x->o)
category 종목명 O 종목(열거형), 지정번호로 구분
category_eng 종목명_영문 O name{@en}
name 이름 X 한자 포함된 전체 이름
eng_name 이름(영어) O name{@en}
kor_name 이름(한글) O name{@ko}
ch_name 이름(한자) O name{@zh}
class 분류 X
class1 분류 O
class2 분류 O
class3 분류 O
class4 분류 O
concept 문화재청(SKOS) 분류명 O 문화재분류 매핑을 위해 추가한 필드
quantity 수량 O
designate 지정일 O 문화재 지정일
address 소재지 O address에서 주소 부분만 추출
address_cls1 시도 O
address_cls2 시군구 O
address_cls3 읍면동 O
address_cls1_eng 시도(영문) O
address_cls2_eng 시군구(영문) O
address_cls3_eng 읍면동(영문) O
address_cls4_eng X 데이터 없음
age 시대 O 열거형
owner 소유자 O
owner_eng 소유자(영문) O name{@en}
manager 관리자 O
manager_eng 관리자(영문) O name{@en}
detail 관리기관 연락처 ?
Contents 설명 O
image_url 이미지URL O 링크가 ';' 구분으로 복수개로 되어 있음. 확장자: JPG
qrcode_url QR이미지 O
movie_url 동영상URL O 링크가 ';' 구분으로 복수개로 되어 있음, 확장자: WMV
street-code X 데이터 없음
building-num X 데이터 없음
문화재청 데이터 필드 및 사용여부 결정
18. 문화재 – 2. 외부 어휘 분석
Modeling
Europeana 의 EDM(European Dana Model) - http://www.europeana.eu/schemas/edm/
19. 문화재 – 3. 문화재 클래스 구조
Modeling
| 보물 | 사적 | 명승 | 천연기념물 | 중요무형문화재 | 중요민속문화재 | …
20. 문화재 – 4. 문화재 분류체계 모델링
Modeling
class1 class2 class3 class4
유적건조물 정치국방 성 성곽시설
유적건조물 종교신앙 불교 탑
기록유산 서각류 금석각류 비
유적건조물 종교신앙 불교 탑
유적건조물 종교신앙 불교 석등
유적건조물 종교신앙 불교 탑
기록유산 서각류 금석각류 비
기록유산 서각류 금석각류 비
유적건조물 종교신앙 불교 탑
유적건조물 종교신앙 불교 탑
유적건조물 종교신앙 불교 탑
유적건조물 종교신앙 불교 석등
유적건조물 종교신앙 불교 불전
유적건조물 종교신앙 불교 불전
유적건조물 종교신앙 불교 불전
유적건조물 종교신앙 불교 탑
유적건조물 종교신앙 불교 석등
유적건조물 종교신앙 불교 불전
유적건조물 종교신앙 불교 불전
유적건조물 종교신앙 불교 탑
유적건조물 종교신앙 불교 탑
유적건조물 교통통신 교통 교량
유적건조물 교통통신 교통 교량
유적건조물 종교신앙 불교 불전
기록유산 서각류 금석각류 비
유물 불교조각 금속조 불상
유물 불교조각 금속조 불상
유물 불교조각 금속조 불상
유물 불교공예 의식법구 의식법구
유적건조물 종교신앙 불교 탑
유물 과학기술 천문지리기구 천문
기록유산 서각류 목판각류 판목류
기록유산 서각류 금석각류 비
문화재청 웹사이트 분류체계
21. 문화재 – 4. 문화재 분류체계 모델링 이슈
Modeling
Another type or subject?
SKOS 적용 여부
11
22
33
44
문화재청 분류모델과 RDF 모델의 불일치
분류체계로서의 대표성
23. 문화재 – 5. Temporal 모델링
Modeling
age 필드값 매핑U RI(PeriodO fTim e 인스턴스) 이름
선사시대 http://ko.w ikipedia.org/w iki/선사_시대 PrehistoryicA ge
석기시대 http://ko.w ikipedia.org/w iki/석기_시대 StoneA ge
청동시대 http://ko.w ikipedia.org/w iki/청동기_시대 BronzeA ge
철기시대 http://ko.w ikipedia.org/w iki/철기_시대 IronA ge
삼국시대 http://ko.w ikipedia.org/w iki/삼국_시대 ThreeKingdom s
고구려 http://ko.w ikipedia.org/w iki/고구려 G oguryeo
백제 http://ko.w ikipedia.org/w iki/백제 Baekje
신라 http://ko.w ikipedia.org/w iki/신라 Silla
가야 http://ko.w ikipedia.org/w iki/가야 G aya
발해 http://ko.w ikipedia.org/w iki/발해 Balhae
통일신라 http://ko.w ikipedia.org/w iki/통일신라 U nifiedSilla
고려시대 http://ko.w ikipedia.org/w iki/고려 G oryeo
조선시대 http://ko.w ikipedia.org/w iki/조선 Joseon
대한제국시대 http://ko.w ikipedia.org/w iki/대한제국 G reatH anEm pire
일제강점기 http://ko.w ikipedia.org/w iki/일제_강점기 JapaneseIm perialism
24. 대한민국 행정구역을 의미적으로 표현하기 위한 정의
행정구역은 국가마다 다름
- 특별시 , 광역시 , 도 , 시 , 군 , 구 , 읍 , 면 , 동 , 리로 구분
- 1 개의 특별시 , 6 개의 광역시 , 8 개의 도 , 1 개의 특별자치시 , 1 개의 특별
자치도로 구성
행정구역 – 행정구역 온톨로지 모델링
Modeling
30. URIs for Real-World Things
Modeling
*
Culture Facilities
Things
- /id/{type}/{id}
- /id/{type}/{id}/{child-type}/{child-id}
Document
- /doc/{type}/{id}
- /doc/{type}/{id}/{child-type}
List
http://lod.datahub.kr/id/cf
http://lod.datahub.kr/doc/cf
303 See other
Facility
http://lod.datahub.kr/id/cf/123456
* id 형식 및 값에 대한 의사결정 필요
31. 이후 진행 계획
Modeling
행정구역 , 우편번호 등 인프라 온톨로지 구축
서울시 문화시설 전국 주요 기관 , 시설로 확
대
11
22
33
44
온톨로지 스키마 고도화
파편화 되어있는 Raw Data 를 Linked Data 로…