2. 시작하기 전에,
‘9장 시소러스, 통제어휘집, 메타데이터’에 수록된 내용을 이해하기에
아래에 소개한 책의 내용이 좀 더 적합하여 그에 맞춰 진행하였다.
<Tagging 태깅>, 진 스미스
4장 태그, 메타데이터, 분류 체계
• 메타데이터로서의 태그
• 통제 어휘집, 택소노미, 다면분류법과 태그를 혼용하는 방법
• 폭소노미의 4가지 특성
• 메타데이터 생태계에서 태그 활용에 대한 철학
3. 국제 질병 분류(ICD) 코드
AIDS 관련 첫 번째 논문이 1983년에 나왔으나 ICD에 질병 이름이 동록되기까지 3년이 걸렸다
(상대적으로 빨리 등록된 사례).
http://dsm5watch.wordpress.com/dsm-5-proposals/dsm-5-proposals-sub-page-2/
4. 메타데이터를 사용하는 목적
메타데이터란 ‘데이터에 대한 데이터’라기 보다는 ‘데이터에 대한 문서’
• 원하는 데이터를 검색하는데 도움이 된다.
• 데이터를 관리하는데 도움이 된다.
• 어떤 데이터를 다른 데이터와 연계할 수 있게 한다.
Like the blind men who encountered an elephant for the first time and each one, finding a different spot,
thought it was a different creature, metadata schemes are each describing aspects of the larger
metadata world.
http://courseweb.lis.illinois.edu/~butler9/LIS501b/current.html
5. 메타데이터의 3가지 유형 : 기술형(Descriptive)
• 어떤 리소스에 대한 상세 정보를 제공한다.
Ex) 디지털 문서 : 제목, 요약, 저자명, 공동 저자명, 머리말 등
회화 : 작품의 크기, 재료, 제목, 제작 시기
• 명확한 정보로 구성되는 관리형 메타데이터나 관계형 메타데이터와 달리, 대부분 주관적이다
어떤 조각상을 적절히 설명하기 위해서는 해당 분야의 지식과 개인의 해석능력이 필요하다.
http://www.kyobobook.co.kr/search/KolisnetSend.jsp?PBarcode=9788970591353&vPIsbn=8970591354&vPSearchGb=1
6. 메타데이터의 3가지 유형 : 관리형(Administrative)
• 여러 개의 리소소를 하나의 집합으로 관리하는데 사용한다.
ex) 등록 일시, 권한 보유자, 담당자 연락처. 사용한 툴.
• 웹 사이트 컨텐츠 관리 시스템은 관리형 메타데이터를 잘 활용한 사례로, 메타데이터를 활용하여
어떤 웹 페이지의 새로운 버전이 작성될 때마다 누가 만들었는지 추적 ・관리한다.
http://goo.gl/KXrw8
7. 메타데이터의 3가지 유형 : 관계형(Structural)
• 리소스 간의 연관 관계를 맺는데 사용한다.
Ex) 어떤 책의 페이지 번호나 호수.
• 책을 디지털 파일로 변환하는 일을 하는 회사는 디지털화 된 단어들이 원래 몇 페이지에 있었는지 연관시키
는 데 관계형 메타데이터를 사용한다.
• 디지털 리소스의 경우, 관계형 메타데이터를 사용해 해당 리소스를 구성하는 개별 파일을 연결하기도 한다.
8. 태그가 활용되는 7가지 유형
태그는 메타데이터이지만 앞서 이야기한 3가지 유형 중 어디에 속하는지 분류하기는 어렵지만 대부분의 경우
아래 도표의 메타데이터의 7가지 기능 중 한가지를 수행한다.
태그 유형 사례
기술형 CSS, webdesign, ajax, Minnesota, drama, gardening, zen, microfinance, music, halo3,
networks, sushi, hibiscus
리소스 Blog, book, video, photo
소유권/출처 Nytimes, genesmith(author(, newriders
의견 Cool, funny, *****, lame, beautiful, crap, defective by design
본인표시 Mystuff, mine, me
직업관리 Toread, todo, work
놀이와 행사 Sqaredcircle, seenlive, aka vogan, poetry
※ 말로우는 ‘사람들이 태깅을 하는 이유가 태그를 쓰는 형태를 결정한다’고 하였다.
10. 택소노미와 통제 어휘집
• 용어간의 관계를 정의하는 분류 체계의 일종.
Ex) 동의어 : math – arithmetic
개념적 관계 : 철학 – 인식론
여러 의미를 가지는 단어 : bank 은행 – 강둑
• 모호함을 줄이고 관련 개념을 연결하고, 현실 세계의
객체 간 관계를 포착함으로써 개념을 좀 더 쉽게 이해
하고 탐색할 수 있도록 도와준다.
http://scriptoriumblogorium.blogspot.com/2011/06/in-beginning-there-was-taxonomy.html
11. 통제 어휘집
• 통제어휘는 여러 단어의 의미를 관리하는 체계로서, 통제어휘를 사용하여 언어의 모호함을 제거할 수 있다.
• 어떤 단어에 대한 여러 단어를 떠올리게 하여 해당 단어의 뜻을 찾지 않아도 되게끔 도와준다.
단어 간의 관계를 나타내는 용어
• 동의어(synonym)
• 동음이의어(homonym)
• 동형이의어(homograph) : 철자가 같으면서 다른 의미를 지니는 단어
ex) bow : 뱃머리 – 인사하다, macintosh : 컴퓨터의 종류 – 사과 품종
• 동일한 철자를 쓰면서도 대소문자 구분에 따라 의미가 달라지는 용어
ex) polish – Polish(폴란드어), nice – Nice(프랑스의 지명(니스))
• 상위어(hypernyms)/하위어(hyponyms) : 단어 의미의 포함 관계를 나타냄.
Ex) 새/오리, 운송수단/자동차
• 부분어(Meronym) : 어떤 개체의 일부분을 나타냄
ex) 부리beak는 새의 부분어.
• 다의어(Polysemes) : 한 개 이상의 유사의미를 가지는 단어.
Ex) chair : 의자 – 어떤 모임을 이끄는 사람(의장)
12. 통제 어휘집의 대표 유형 – 동의어 순환목록
• 같은 의미를 지닌 2개 이상의 단어를 제공한다.
• 동의어를 사용하면 원래 단어와 약어 간의 차이를 쉽게 알 수 있고, 지역에 따라 다르게 쓰는 동의어도 쉽게
다룰 수 있다.
• 활용 사례 : 검색엔진에서 동일한 검색어를 조회해서 해당 단어 모두에 해당하는 검색결과를 보여주는 경우.
pop = soda = coke
Cascading
CSS = Style Sheets = Style sheets
14. 통제 어휘집의 대표 유형 – 전거 파일
• 동의어 순환목록과 유사한 개념이나, 여러 단어 중 하나를 선호 단어로 지정한다. 지정한 단어가 사용자에
게 제시되고 나머지 용어는 해당 단어를 가리키는 역할로 사용된다.
Ex) ‘soda’에 대한 더 많은 정보를 보시려면 ‘pop’ 페이지를 참고하세요.
• 전거 파일은 많이 사용되는 단어나, 별명, 변형어, 약어 등을 하나의 공식 단어로 매핑하는데 도움이 된다.
Marchall
Eminem = Slim Shady = Mathers
바비 킴 = 바비킴 = Bobby Kim
17. 통제 어휘집의 대표 유형 – 전거 파일
http://angelhalowiki.com/r1/wiki.php
18. 사용자 참여형 통제 어휘집
http://www.librarything.com/work/4690003
19. 사용자 참여형 통제 어휘집
LibraryThing : 소셜 카탈로그 웹 사이트
• 태깅과 통제 어휘를 적절히 융합한 사이트.
• 사용자가 직접 사이트 내의 태그를 ‘병합combine tages’하거나 분리할 수 있다.
단, 태그 병합은 두 개의 태그 간에 의미 없는 차이가 생길 경우 이를 해소할 목적으로만 사용해야 한다는
규칙을 따른다.
Ex) INFORMATION ARCHITECTURE, architettura dell'informazione ⇒ information architecture
• 동일한 의미의 태그가 중요한 차이가 있다는 가정하에 병합되지 않는 경우.
Ex) humor : 미국 작가들의 저서, humour : 영국 작가들의 저서
• 이런 차이를 구분해야 한다는 문제가 LibraryThing의 커뮤니티에 제기되었다. 사용자들이 태그를 병합하
고 분리할 수 있게 함으로써, LibraryThing은 태그 간의 차이에 대한 대화를 계속 나눌 수 있었다.
21. ‘택소노미(Taxsonomy)
• 통제 어휘집의 일종으로, 관계 있는 두 단어를 부모/자식 혹은 광의/협의 관계로 연관시키는 역할을 한다.
• 택소노미를 활용하여 상위어와 하위어, 부분의와 전의holonym의 관계를 정의한다.
• 대부분의 택소노미는 현실 세계를 반영한 계층형 모델로, 한 항목이 한 위치에만 들어갈 수 있다.
부모
자녀 자녀
24. ‘택소노미(Taxsonomy)
• Amazon.com : 한 항목이 택소노미 트리 내의 여러 가지에 들어갈 수 있는 다층구조polyhierchy로 제품
의 택소노미를 구성한다.
http://www.amazon.com/Steve-Jobs-Walter-Isaacson/dp/1451648537/ref=sr_1_1?ie=UTF8&qid=1320211338&sr=8-1
25. 시소러스(Thesaurus)
• 택소노미가 더욱 개선된 형태.
• 관련 있는 항목 간에 광의 ・협의 등의 관계를 지정할 수 있고, 관련 개념을 위 ・아래 계층으로 이동할 수 있다.
이런 연합associative 관계를 통해 단어와 개념 간에 좀 더 분명한 연결이 가능하다.
Ex) 행위 – 결과 : 글쓰기 – 책, 주제 – 대상 : 인식론 - 지식
http://www.creativetechs.com/iq/visual_thesaurus.html
26. 버블업 폭소노미(Bubble-up Folksonomies)
• Yahoo의 연구원인 Tom Coates가 소개한 기법.
• 입력된 태그들로 택소노미를 만들지 않고, 태깅을 이용해서 기존의 택소노미 내용을 보완하는 방식.
• 온라인 음악 사이트에서 한 곡에 붙은 태그들은 상위로 올라가 앨범과 아티스트에 대한 설명으로 활용된다.
http://www.plasticbag.org/archives/2005/09/how_to_build_on_bubbleup_folksonomies/ http://tagsonomy.com/index.php/tom-coates-on-bubble-up-folksonomies/
28. 버블업 폭소노미(Bubble-up Folksonomies)
Ex) Technorati.com : 블로그 검색엔진으로 개별 블로그 포스트에 붙은 태그를 버블업 해서 해당 블로그를 설
명하는데 사용한다.
LibraryThing : 도서 정보 관련 태그에 버블업 방식을 적용하고 있다. 내가 만든 컬렉션에 속한 책마다 개별
적으로 태그를 추가할 수 있으며, 어떤 책의 특정 판에 적용한 태그는 버블업되어 작업목록 레벨로 올라간
다.
http://www.librarything.com/work/11434526
29. 다면분류법 (Faceted Classification System)
• 어떤 항목의 관련 특성을 기반으로 분류를 구성하는 방식.
• 인도의 문헌정보학자인 S.R. 랑가나단S.R.Ranganathan이 만들었으며, 한 객채를 다차원으로 분류하고
여러 경로로 접근한다.
다면분류법으로 의류 분류하기
• 의류 유형 : 블라우스, 셔츠, 재킷, 바지, 스커트
• 색상 : 자주색, 하늘색, 노란색, 하얀색
• 사이즈 : S, M. L, XL
• 소재 : 면, 울, 레이온, 실크
http://goo.gl/LJ5jK
30. 다면분류 태깅
: 태그를 여러 측면(facet)으로 분리해 보는 방식
다면분류 태깅의 잠재적인 장점
• 각각의 측면을 통해 태그를 좀 더 명확한 의미로 쓸 수 있다.
: 사람에 해당하는 면을 제공하면 거기에 사용된 Helena는 지명이 아니라 사람 이름.
• 각 측면을 통해 검색결과를 개선할 수 있고, 명확하게 관련된 개념에 해당하는 태그들을 묶어서 좀 더 쉽게
탐색하도록 할 수 있다.
• 각 측면을 통해 다른 방법으로는 볼 수 없었던 사람 ・위치 ・행사 등 다른 종류의 태그 간의 연결관계를 만들
수 있다.
일반적인 다면분류법과 다면분류 태깅의 차이
• 각 측면을 정의한다는 면에서는 같지만, 다면분류 태깅에서는 측면 용어를 미리 정의하지 않는다.
: 다면분류 태깅에서는 사람들이 태그를 추가할수록 해당 용어의 수가 지속적으로 증가한다.
31. 다면분류 태깅 사례 : buzzillions.com
• 지품 리뷰에 택소노미, 태그, 다면분류법을 모두 활용한다.
• 구조화된 리뷰를 사용하기 때문에 제품에 대한 의견을 문장으로 쓰는 대신 태그를 사용한다. 이 태그들을
활용해서 사이트를 내비게이션할 수 있도록 하여 사용자가 관심을 생길만한 다른 제품을 찾는데 도움을 준
다.
http://www.buzzillions.com/reviews/canon-powershot-sx230-hs-digital-camera-black-reviews#writeReview
32. 다면분류 태깅 사례 : buzzillions.com
버질리온즈닷컴의 태그 활용 방식
• 각 제품 리뷰에는 장점Pros, 단점Cons, 특징Best Uses, 자기소개Describe Yourself의 4가지 측면을 제공
하며, 각각 태그 개수에 제한은 없다. 다만 태그 작성 시 제품의 종류에 따라 많이 사용되는 태그를 추천해
준다.
http://www.buzzillions.com/reviews/canon-powershot-sx230-hs-digital-camera-black-reviews#writeReview
38. 태그와 측면(Facets)를 혼합 적용할 때의 3가지 원칙
• 항상 쉬워야 한다.
: 가능한 한 쉽게 태깅할 수 있어야 한다.
• 차근차근.
: 태그를 이용해서 유용한 구조를 만들 때 작은 의미만 적용해도 많은 부대효과를 얻을 수 있다.
• 적은 인원으로 최대 효과 만들기.
: 소수의 인원이 편집하는 위키피디어처럼, 소수의 사용자가 태그를 측면Facets에 적용하면, 다수의 사용자
들에게 의미 있는 구조를 만들 수 있다.
39. 폭소노미(Folksonomy)
• 사람들folks + 택소노미taxonomy(<검색 2.0 : 발견의 진화, 182p)
• 소셜 태깅으로 인해서 발생하는 상향식 분류 체계를 의미한다.
• 일반적인 분류 체계는 어떤 단어와 이를 가리키는 개념 간의 관계(광의・협의・동등・연관)를 정의하지만,, 폭
소노미에서는 태그 간의 관계를 사용 패턴에서 유추해낸다.
40. 폭소노미(Folksonomy)
• delicious.com에 CSS, ajax, webdesign이라는 태그가 모두 포함된 북마크가 있다.
이 세 가지 태그 간에 의미있는 관계가 있다고 할 수 있을까?(웹 관련자라면 바로 알아차린다)
CSS
ajax
? webdesign
41. 폭소노미(Folksonomy)
• 다른 소셜 북마킹 사이트인 Connotea에서, ccr5, hiv, cxcr4라는 세 가지 태그가 서로 중첩된 것을 보면
그 관계를 짐작할 수 있는가?
이 태그들이 함께 등장하는 횟수가 빈번하므로 뭔가 관련이 있을거라 추측할 수 있지만, 어떤 관계인지는
알기 어렵다.
HIV
ccr5
cxcr4
http://www.connotea.org/search?q=hiv+cxcr4
42. 폭소노미(Folksonomy)
• 여러 리소스에 걸쳐 다양한 사용자들이 두 개의 태그를 동시에 계속 사용하더라도, 그 두 태그가 동일한 의
미라고 주장할 수는 없다.
해리슨 인디아나
포드 존스
• 현실적으로 의미는 통계보다는 뉘앙스쪽에 더 가깝다고 할 수 있다.
그러나 모호성 ・함의성 ・중의성과 같은 단어의 유연성은 언어를 재밌게 만들고, 이런 점이 사람들이
태깅에 매력을 느끼게 한다.
43. 폭소노미의 특성 : 독립성
• 폭소노미를 만들려면 사용자 스스로 사용할 태그를 마음대로 선택할 수 있어야 한다. 미리 선택된 범주에
국한해서 선택하도록 강요해서는 안된다.
• 자동 태그 추천 기능을 통해 사용자가 좀 더 쉽게 태그를 작성할 수 있도록 유도하는 경우에도, 사용자가 직
접 새로운 태그를 추가할 수 있다면 독립성을 유지하는 것으로 볼 수 있다.
44. 폭소노미의 특성 : 집합성(Aggregation)
• 많은 사용자의 태그를 한데 모으면 폭소노미가 생성되는데, 집합성은 자동으로 모든 태그를 끌어오는 특성
을 의미한다.
• 수동으로 택소노미를 만들기 위해서 태그의 표본을 추출하면 폭소노미와는 다른 결과가 된다.
Ex) Etsy는 사용자 태그를 관리자가 가공하여 카테고리를 만듬.
• 활발하게 참여하는 커뮤니티에서는 재밌는 폭소노미가 만들어지겠지만, 적은 수의 사람이나 활발하지 않은
사용자의 태그를 모으면 그리 유용하지 않은 패턴 결과가 나올 것이다.
45. 폭소노미의 특성 : 추론성
• 폭소노미는 태그가 어떻게 사용됐는지 추론결과에 따라서만 관계가 이루어진다.
• 의미구조와 뉘앙스는 약하다는 단점이 있지만, 실제 사용자들이 선택한 단어와 활용 패턴에 기반해서 이런
관계가 파생되어 나온다는 점에서 가치가 있다.
46. 폭소노미의 다양한 추론 방법
• 태그 사용 횟수를 활용해 가장 인기 있는 태그를 찾아 낸다(가장 간단한 태깅 패턴 조사 방법).
47. 폭소노미의 다양한 추론 방법
• 함께 사용된 태그의 동시 사용 횟수를 활용한다.
: 모든 태그에 대해서 함께 사용된 다른 태그와 동시에 사용된 횟수를 카운트한다. 이 통계에 따라 관련 태
그를 알 수 있다. 동시에 사용된 태그 목록은 시소러스의 관련 단어와 어느 정도 일치합니다.
• 클러스터링 알고리즘을 사용해서 두 개의 태그가 동시 사용된 내역을 조사하고 함께 사용될 확률을 계산한
다.
: 동시 사용될 확률이 매우 높은 태그들을 묶으면 태그 클러스터를 뽑아낼 수 있다.
(<태깅 Tagging> 111p, 클러스터링 참고)
※ 이러한 방법들은 다른 분야에서도 사용되는 방법들이다.
48. 폭소노미가 유용한 분야
• 명칭이 확정되지 않았거나 계속 변하고 있는 경우
: 관련 분야가 계속 바뀌고 있는 경우 일반적인 분류 방식은 적용하기 어렵지만, 폭소노미를 활용하면 일정
한 구조를 만들어갈 수 있다.
• 동적으로 변하는 정보 공간
: 유지 관리하려고 하는 정보 공간이 매우 동적으로 변화하는 경우, 폭소노리를 통해 변화에 대응할 수 있다.
• 의미론적 관계가 크게 중요하지 않은 경우
: 사용자가 생성하는 구조인 폭소노미만으로도 충분하다.
• 다양한 관점이 필요한 경우
: 대부분의 분류 체계가 한 가지 관점을 반영하는 반면, 폭소노미는 다양한 관점을 반영할 수 있다.
• 사용자의 활동성을 활용해야 하는 경우
: 폭소노미는 사용자들의 활동 결과에 따라 달라진다. 이런 사용자들이 있어야 폭소노미를 얻을 수 있다.
49. 마치며,
발표 자료에서 다룬 <태깅Tagging> 4장의 내용들은 좁은 의미에서 폭소노미를 다룬 것이라고 한다.
폭소노미는 태깅과 관련된 모든 개념을 아우를 정도로 넓은 개념으로, 더 넓은 의미의 폭소노미에 대해 궁금하
다면 <태깅Tagging>의 5장을 참고하라는 소개가 되어 있다.(태그, 클라우드, 인기도 기반의 내비게이션 등을
다룬다고 함)
<검색2.0 : 발견의 진화,>
<인포메이션 아키텍처>의 저자인 피터 모빌 지음.
“다시 메타데이터로’ 168~203p 참고
택소노미, 온톨로지, 폭소노미, 네트워크 등에 대해 다양한 관점과
논의들을 다룬다. 발표에서는 좀 더 실무적인 면에서 살펴보기 위
해 <태깅>위주로 다루었다.