8. (五)依結構化或複雜度,可分類如下:
第一類:未結構化,未使用標準建立的索引。例:蒐尋引擎根據網頁 HTML
的"TITLE" tag 所建立的索引。
第二類:相當結構化,不複雜,但提供足夠的資源描述資訊。例:Dublin Core、
OCLC NetFirst 資料庫。
第三類:相當結構化且複雜,提供詳細的資源描述資訊。例:MARC、EAD、
CIMI、TEI Header 等。
2
三、重要資訊描述格式簡介
近年來,Metadata 應用在各種不同類型資訊的發展十分蓬勃,例如:應用最廣不限特定主題或
資料類型的 Dublin Core、人文學與語言學描述的 TEI (Text Encoding Initiative)、政府資訊描述
的 GILS (Government Information Locator Service)、地理資訊描述的 CSDGM (Content Standards
for Digital Geospatial Metadata)、藝術品描述的 CDWA (Categories for the Description of Works of
Art)、博物館藏品描述的 CIMI (Consortium for the Computer Interchange of Museum
information)、音樂資訊的 SMDL (Standard Music Description Language) 等。
metadata 泛指有關資料屬性的描述性資料,或資訊組織的方法與格式。metadata 所牽涉之問題
尚有:編碼方式、標記方式、資訊描述項目及描述依據、主題分析、權威控制、字碼、使用範
圍、通訊協定、系統開發等問題。以上的項目,也是在設計 metadata 時所要考量的要項。
(一)Dublin Core
1.概述
都柏林核心集(Dublin Core)為描述網路上的電子資源的簡單格式。初期 Dublin Core 的設計特別
是針對文獻式(document-like-object)的網路資源,目前已廣泛的使用在 HTML 格式的文件
9. 上。在第三次 Dublin Core Workshop(1996)中提出以 Dublin Core 描述影像的討論之
後,Dublin Core 已被用在影像的描述上。
都柏林核心集(Dublin Core Metadata Element Set,簡稱 DC)是 1995 年 3 月由國際圖書館電腦中
心(OCLC)和 National Center for Supercomputing Applications(NCSA)所聯合贊助的研討會,
在邀請五十二位來自圖書館、電腦、網路方面的學者和專家,共同研討下的產物,目的是希望
建立一套描述網路上電子文件特色的方法,來協助資訊檢索。因此在研討會的報告中,將
metadata 定義為資源描述(Resource Description),而研討會的中心問題是如何用一個簡單的
metadata 記錄描述種類繁多的電子物件。根據研討會的報告,都柏林核心集處理的對象,將祇
限於「類文件物件」(Document-Like Objects,簡稱 DLO),亦即可用類似描述傳統印刷文字
媒體方式,加以描述的電子檔案。同時因為研討會的目標是發展一個簡單有彈性,且各種專業
人員也可輕易了解和使用的資料描述格式。就項目的基本設計原則而言,他們主張先建立一套
描述資料的最小核心資料項。使此 metadata 的資料項,同時擁有意義明確、彈性、最小規模三
種特色。在設計上所秉持的原則是:內在本質原則、易擴展原則、語法獨立原則、無必須項原
則、可重覆原則、可修飾原則。(吳政叡 http://dimes.lins.fju.edu.tw/dublin/)
都柏林核心集原只是一組描述集,然而很快地便引起全球來自藝術、科學、教育、商業、與政
府單位等各領域之資訊提供者的注意。由於對於跨領域資源搜尋問題的關注,使得後來 DCMI
研討會參與者持續增加,都柏林核心描述集的十五個欄位就是科際整合與國際共識的結果。截
至 2003 年 6 月 止 , DC 已 有 二 十 幾 種 語 文 譯 本 , 也 被 CEN/ISSS (European Committee for
Standardization / Information Society Standardization) 所接受,並被記錄為兩份網際網路 RFCs
(Requests for comments)文件,此外也出現在 W3C(WWW Consortium)及 Z39.50 標準中。同時已
有三個國家採用都柏林核心集描述其政府資訊,以促進其政府資訊的搜尋,另外,至少還有五
個以上的國家正在考慮將 DC 列為國家資訊標準。
DC 並不想要取代其他的詮釋資料格式,而希望與其他的標準並存,使得一筆描述記錄中包含
不同標準、簡單與複雜兼具的詮釋資料。如在 RFC2731 文件中所舉的例子就是混合 HTML 和
DC 的實例。
DC 的簡易性有其優點也有其缺點,由於其簡易性,因而降低描述資料的成本並增進資訊的互
通性,但相對的,也因其簡易性,而無法支援複雜且語意豐富的詮釋資料架構。事實上,都柏
林核心集也在到底是要提供語意豐富的資訊或要增加資訊的可見度中做取捨。不過都林核心集
鼓勵將複雜的詮釋資料架構組合到都柏林核心集中,以彌補此難以兩全的缺失。語意豐富的詮
10. 釋資料格式為了轉出或為了跨領域的資訊查尋也可以對映到都柏林核心集。換言之,簡單的
DC 記錄可以做為建立複雜的詮釋資料之基礎。
Dublin Core 最大的優點就在於簡單。開放的特性使得數位圖書館計畫可以採用十五個核心欄位
擴展更細的詮釋資料格式,也可以採用第一層的十五個欄位作為跨系統的詮釋資料交換格式,
或作為異質系統分散查尋的資料格式,如 Open Archive Initiative 即支持 Dublin Core 作為資料抓
取之格式。不過,也由於 DC 的開放性,讓每一個要以 DC 為基礎來擴充格式的使用單位花很
多時間去討論如何擴充。
2. DC 的欄位內容
The Elements
Element Name: Title 題名 Element Name: Title 題名 Element Name: Title 題名
Label:
題名 Title
Definition:
資源所賦予的名稱。A name given to the resource.
Comment:
題名是資源的正式名稱。Typically, Title will be a name by which the resource is formally known.
Element Name: 創作者 Creator Element Name: 創作者 Creator Element Name: 創作者 Creator
Label:
創作者 Creator
Definition:
資源之主要創作者。An entity primarily responsible for making the content of the resource.
Comment:
創作者包括個人、團體機構或服務系統。Examples of Creator include a person, an organization, o
name of a Creator should be used to indicate the entity.
Element Name: 主題 Subject Element Name: 主題 Subject Element Name: 主題 Subject
Label:
主題和關鍵詞 Subject and Keywords
Definition:
有關資源內容之描述。A topic of the content of the resource.
Comment:
可用關鍵詞或分類號來表示資源之內容,建議使用控制詞彙或分類表。Typically, Subject will b
key phrases or classification codes that describe a topic of the resource. Recommended best practice is
controlled vocabulary or formal classification scheme.
Element Name: 簡述 Description Element Name: 簡述 Description Element Name: 簡述 Description
Label:
簡述 Description
Definition:
對於資源之相關說明。An account of the content of the resource.
11. Comment:
簡述可包括摘要、目次、圖示資料之來源說明、或對於內容的文字敘述等。
Examples of Description include, but is not limited to: an abstract, table of contents, reference to a gra
content or a free-text account of the content.
Element Name: 出版者 Publisher Element Name: 出版者 Publisher Element Name: 出版者 Publisher
Label:
出版者 Publisher
Definition:
使資源可供取用者。An entity responsible for making the resource available
Comment:
出版者包括個人、團體機構或服務系統。Examples of Publisher include a person, an organization,
name of a Publisher should be used to indicate the entity.
Element Name: 貢獻者 Contributor Element Name: 貢獻者 Contributor Element Name: 貢獻者 Contributor
Label:
貢獻者 Contributor
Definition:
除創作者外,對於資源內容之創作有貢獻者。An entity responsible for making contributions to th
Comment:
貢獻者包括個人、團體機構或服務系統。
Examples of Contributor include a person, an organization, or a service. Typically, the name of a Cont
indicate the entity.
Element Name: 日期 Date Element Name: 日期 Date Element Name: 日期 Date
Label:
日期 Date
Definition:
在資源生命週期中,某事件之日期。
A date of an event in the lifecycle of the resource.
Comment:
日期通常可用來表示資源的創作或可供使用的時間。建議遵循 ISO 8601 [W3CDTF]之規範著錄
DD 的格式著錄。
Typically, Date will be associated with the creation or availability of the resource. Recommended best
date value is defined in a profile of ISO 8601 [W3CDTF] and includes (among others) dates of the for
Element Name: Type Element Name: Type Element Name: Type
Label:
資源類型 Resource Type
Definition:
資源之性質或類型。The nature or genre of the content of the resource.
Comment:
資源類型包括描述資源之性質、功能、類別,以及描述之單位為單件或合集作品等。建議使用
所定義的詞彙(DCMI Type Vocabulary, DCT)。資源之實體或是數位媒體之描述,則使用 For
Type includes terms describing general categories, functions, genres, or aggregation levels for content
practice is to select a value from a controlled vocabulary (for example, the DCMI Type Vocabulary [D
12. physical or digital manifestation of the resource, use the FORMAT element.
Element Name: 資料格式 Format Element Name: 資料格式 Format Element Name: 資料格式 Format
Label:
資料格式 Format
Definition:
資源之實體或數位化媒體之描述。The physical or digital manifestation of the resource.
Comment:
資料格式包括媒體類型或資源的度量資料,資料格式也可以用來表明呈現或操作資源時需用的
量資料則包括高廣尺寸與放映時間。建議使用控制詞彙,如網路媒體類型 MIME (Multipurpose
所定義的電腦媒體格式。
Typically, Format may include the media-type or dimensions of the resource. Format may be used to i
hardware, or other equipment needed to display or operate the resource. Examples of dimensions inclu
Recommended best practice is to select a value from a controlled vocabulary (for example, the list of I
[MIME] defining computer media formats).
Element Name: 識別碼 Identifier Element Name: 識別碼 Identifier Element Name: 識別碼 Identifier
Label:
資源識別碼 Resource Identifier
Definition:
資源在某環境中明確的辨識資料。An unambiguous reference to the resource within a given contex
Comment:
建議利用字串或數字組成的識別系統來辨識資源,如:URI (Uniform Resource Identifier)(含 U
Object Identifier),以及 ISBN (International Standard Book Number)等。Recommended best practic
by means of a string or number conforming to a formal identification system. Formal identification sy
limited to the Uniform Resource Identifier (URI) (including the Uniform Resource Locator (URL)), th
(DOI) and the International Standard Book Number (ISBN).
Element Name: 來源 Source Element Name: 來源 Source Element Name: 來源 Source
Label:
來源 Source
Definition:
說明衍生出本資源的原始資源。
A Reference to a resource from which the present resource is derived.
Comment:
本資源可能完全或部份由原始資源衍生而出。建議利用字串或數字所組成的識別系統來表示其
The present resource may be derived from the Source resource in whole or in part. Recommended bes
referenced resource by means of a string or number conforming to a formal identification system.
Element Name: 語文 Language Element Name: 語文 Language Element Name: 語文 Language
Label:
語文 Language
Definition:
資源內容之語文。A language of the intellectual content of the resource.
Comment:
建議使用 RFC1766 並併用 ISO639 標準,該標準使用兩個與三個字母做為語文代碼。之後,可
13. 家代碼。例如,'en'或'eng'代表英語,'akk'代表阿卡丁語(Akkadian),'en-GB' 代表在英國使用的英
Recommended best practice is to use RFC 3066 [RFC3066] which, in conjunction with ISO639 [ISO6
three-letter primary language tags with optional subtags. Examples include "en" or "eng" for English,
"en-GB" for English used in the United Kingdom.
Element Name: 關連 Relation Element Name: 關連 Relation Element Name: 關連 Relation
Label:
關連 Relation
Definition:
相關資源之參照。A reference to a related resource.
Comment:
建議使用字串或數字所組成的識別系統來辨識參照資源。
Recommended best practice is to identify the referenced resource by means of a string or number conf
identification system.
Element Name: 時空涵蓋範圍 Coverage Element Name: 時空涵蓋範圍 Coverage Element Name: 時空涵蓋範圍 C
Label:
時空涵蓋範圍 Coverage
Definition:
資源內容所涵蓋之空間或時間。The extent or scope of the content of the resource.
Comment:
時空涵蓋範圍包括地點(地名或地理座標)、時期(時期名稱、日期或期間)或政治轄區(如
用控制詞彙(如 Thesaurus of Geographic Names [TGN]),並使用數字表示地理座標或日期時間
Typically, Coverage will include spatial location (a place name or geographic coordinates), temporal p
or date range) or jurisdiction (such as a named administrative entity). Recommended best practice is to
controlled vocabulary (for example, the Thesaurus of Geographic Names [TGN]) and to use, where ap
time periods in preference to numeric identifiers such as sets of coordinates or date ranges.
Element Name: 權限管理 Rights Element Name: 權限管理 Rights Element Name: 權限管理 Rights
Label:
權限管理 Rights Management
Definition:
有關權限的相關資訊,包括資源原有的或被賦予的權限。Information about rights held in and ove
Comment:
權限管理包括資源的權限申明,或說明提供該資源的服務機構。權限資訊通常包括智慧財產權
若此權限管理的欄位未著錄,使用者亦不得擅自認定資源本身原有的或被賦予的權限。
Typically, Rights will contain a rights management statement for the resource, or reference a service p
Rights information often encompasses Intellectual Property Rights (IPR), Copyright, and various Prop
element is absent, no assumptions may be made about any rights held in or over the resource.
Dublin Core 除了 15 個基本的欄位之外,為了豐富核心集的內含和擴大其應用範圍,1997 年 3
月在澳洲坎培拉的國家圖書館舉辦了都柏林核心集的第四次研討會,會議的主要成果是「坎培
14. 拉修飾詞」(Canberra Qualifier),共有語言(Language)修飾詞、架構(Scheme)修飾詞、次項目
(Subelement)修飾詞等三種。 都柏林核心集中的修飾詞,是對項目的內容和語意,做進一步的
界定和說明,使其意義更明確。
OCLC 主導創設 Dublin Core 目的,是希望一方面能解決 MARC 在應付網路文件上的困境,另
一方面能有一套簡單的資源描述格式,讓眾多非圖書館的專業人士來使用,以最少成本來解決
網路文件快速增加的問題。以下所有的資料項都可重複,且是選擇性的,並無所謂的必備項,
與 MARC 不同。
Dublin Core 的設計原則中,包括了語法獨立原則(Syntax-Independence),在此詮釋資料成熟前,
將盡量避免制定特定語法。
目前 Dublin Core 的發展相當被看好,使用單位也相當多。根據 OCLC 在 1999 年 6 月的統計,
全球至少有四十餘個不同領域的數位化計畫使用 DC 做為其資訊組織的基礎,其中不乏相當知
名者。
Dublin Core 雖然只是一個很簡略的資料描述格式,但它是圖書館界試圖解決電子文件處理難題
上的一個新嘗試,其所立下的原則和典範正是未來資訊描述格式的趨勢之一。而另一個新的發
展和趨勢則是由網際網路界甚具影響力的 W3C(World Wide Web Consortium)所主導的
RDF(Resource Description Framework),它可攜帶多種不同的詮釋資料來往於網際網路和 WWW
上,因此 Dublin Core 與 RDF 的結合已是未來必然的發展趨勢。
(二)TEI header
1.歷史發展
TEI 是由電腦與人文學會(Association for Computers and the Humanities,簡稱 ACH)、計算語言學
會(Association for Computational linguistics,簡稱 ACL),文學與語言計算學會(Association for
Literary and Linguistic Computing,簡稱 ALLC)等三單位合作的計劃,並組成技術委員會
(Technical Review Committee)來負責 TEI 的發展。TEI 的目的是要為人文學的電子文獻定義一個
通用交換格式。使用的對象包括人文學者、維護電子文件的圖書館員、出版界、與其他想製作
傳播電子文件的人員。此一計畫名為 Text Encoding Initiative (TEI)。文件編碼(TEI)標準建立
22. 14、Use Constraints (使用限制)
15、Point of Contact for Further Information(進一步資訊接洽者)
16、Supplemental Information(補充資訊)
17、Cross Reference(參見)
18、Schedule Number (目錄編號)
19、Control Identifier(控制識別碼)
20、Record Source (紀錄來源)
21、Original Control Identifier (原始控制識別碼)
22、Date of Last Modification (最後修改日期)
(2)各核心項目的著錄及其子目
項目 1、Title(題名):必須著錄、不可重複、非控制語彙。
例:Title: The United State Government Manual。
項目 2、Originator(創設者):必須著錄、不可重複、控制語彙。
控制語彙須出自 U.S. Government Manual。
例:Originator:National Archives and Records Administration(NARA)。
項目 3、Controlled Vocabulary(控制語彙):選擇項、可重複。
包括二個子項:
23. 1.Index Terms-Controlled(索引):選擇項、不可重複項、控制語彙項。
2.Thesaurus(索引典):選擇項、不可重複項、非控制語彙項。
項目 4、Local Subject Index(本地主題索引):選擇項、不可重複、非控制語彙。
項目 5、Abstract(摘要):必須著錄、不可重複、非控制語彙。
摘要以少於五百字為原則。
項目 6、Purpose(目的):必須著錄、不可重複、非控制語彙。
項目 7、Agency Program(機構計畫):必須著錄(若描述對象是自動化資訊系統
時,否則為選擇項)、不可重複、非控制語彙。
項目 8、Spatial Reference(地理參考資訊):
包括二個子項:
1.Bounding Rectangle(四周邊界):選擇項、不可重複、控制語彙。
其下又分為四個子項:
West Bounding Coordinate(Western-most Longitude)(西邊經度)
East Bounding Coordinate(Eastern-most Longitude)(東邊經度)
North Bounding Coordinate(Northern-most Latitude)(北邊緯度)
South Bounding Coordinate(Southern-most Latitude)(南邊緯度)
例:West Bounding Coordinate:179°
East Bounding Coordinate:60°
24. North Bounding Coordinate:72°
South Bounding Coordinate:18°
2.Gographic Name(地理名稱):選擇項、可重複、非控制語彙。
其下又分為二個子項:
Geographic Keyword Name(地理關鍵名稱):選擇項、可重複、非控制語彙。
Geographic Keyword Type(地理關鍵名稱型態):選擇項、可重複、非控制語
彙。例:Geographic Keyword Type(GNIS):United States。
項目 9、Time Period of Content(內容涵蓋時期):
包括二個子項:
1.Time Period - Structured(結構式涵蓋時期):選擇項、可重複、控制語彙。例:
Time Period - Structured:19961112 - 。
2.Time Period – Textual(文字描述式涵蓋時期):選擇項、可重複、非控制
語彙。例:Time Period - Textual:28 April 1995 - [ongoing]。
項目 10、Availability(文件索取資訊):必須著錄、可重複、非控制語彙。
包括七個子項:
1.Distributor(流傳機構):必須著錄項、不可重複項、非控制語彙項。
其下又分為十一個子項:
Distributor Name(流傳者名稱)。
Distributor Organization(流傳機構)。
Distributor Street Address(流傳者街址)。
26. 項目 12、Methodology (文件製作方法):選擇項、不可重複、非控制語彙。
項目 13、Access Constraints(存取限制):必須著錄、不可重複、非控制語彙。
例:Access Constraints:None。
項目 14、Use Constraints (使用限制):必須著錄、不可重複、非控制語彙。
例:Use Constraints:Written releases from the owners of these rights are required
for duplication。
項目 15、Point of Contact for Further Information(進一步資訊接洽者):
必須著錄、不可重複、非控制語彙。
包括十一個子項:
Contact Name(諮詢者名稱)。
Contact Organization(諮詢機構)。
Contact Street Address(諮詢者街址)。
Contact City(諮詢者所在城市名稱)。
Contact State(諮詢者所在州名稱)。
Contact Zip Code(諮詢者郵遞區號)。
Contact Country(諮詢者國家名稱)。
Contact Network Address(諮詢者網路位址)。
Contact Hours of Service(諮詢者服務時間)。
Contact Telephone(諮詢者電話號碼)。
27. Contact Fax(諮詢者傳真號碼)。
項目 16、Supplemental Information(補充資訊):選擇項、不可重複、非控制語彙。
項目 17、Cross Reference(參見):選擇項、可重複項。
包括三個子項:
1.Cross Reference Title (參見題名):必須著錄、不可重複、非控制語彙。例:Cross
Reference Title:1990 Census LOOKUP。
2.Cross Reference Linkage(參見連結):必須著錄、不可重複、非控制語彙。
例:Cross Reference Linkage:http://blue.lins.fju.edu.tw。
3.Cross Reference Type(參見文件型態):必須著錄、不可重複、非控制語彙
例:Cross Reference Type:text/html。
項目 18、Schedule Number (目錄編號):必須著錄項(若所描述的對象是自動化資
訊系統或因應紀錄管理需求時,否則為選擇項)、不可重複、控制語彙。
例:Schedule Number:Scheduled:NCI-442-80-008/117A。
項目 19、Control Identifier(控制識別碼):必須著錄、不可重複、控制語彙。〔機構縮寫名
稱請參照 U.S. Government Manual。〕
例:Control Identifier:USGS000145。
〔本項記載此筆紀錄的創造或最後修改機構,機構縮寫名稱請參照 U.S. Government
Manual。〕
項目 21、Original Control Identifier (原始控制識別碼):選擇項、不可重複、控制語
彙。
〔當中介機構修改某筆 GILS 紀錄時,若將其自身編號填入 Control Identifier,則須要在此
填入原始的 Control Identifier,以便回溯追蹤。〕
28. 項目 22、Date of Last Modification (最後修改日期):必須著錄、不可重複、控制語
彙。例:Date of Last Modification:19961108。
(五)地理資訊描述的 CSDGM (Content Standards for Digital Geospatial Metadata)
CSDGM(Content Standards for Digital Geospatial Metadata) 是美國聯邦地理資料委員會
FGDC(The Federal Geographic Data Committee)訂定之描述空間數位資料目錄的標準格
式。CSDGM Version 1 (FGDC-STD-001):提供了後設資料應用的基本架構(framework),並
於 1994 年 6 月 8 日獲得認可。 CSDGM Version 2 (FGDC-STD-001-1998):取代原先的
CSDGM v1(但仍保持相容性),增加了簡介(profile)以及使用者自訂元素,於 1998 年 6 月 19 日
獲得認可。 http://geology.usgs.gov/tools/metadata/standard/metadata.html
(六)藝術品描述的 CDWA (Categories for the Description of Works of Art)
CDWA 主要用於博物館的收藏,由美國 J. Paul Getty Trust 資助的 AITF(the Art Information
Task Force)開發,為提供和使用藝術資訊團體描述藝術作品,提供结構化工
具。http://www.getty.edu/research/institute/standards/cdwa/
(七) 視覺資源核心類目 VRA Core
全名是 Visual Resources Association Core Categories。
VRA Core 是為對藝術、建築、史前古器物、民間文化等藝術類可視化資源而建立的。主要用於
博物馆的收藏。http://www.vraweb.org/vracore3.htm
29. (八)博物館藏品描述的 CIMI (Consortium for the Computer Interchange of Museum information)6
1.簡介
目前國際上致力於博物館資訊交換的機構,首推博物館資訊交換協會(The Consortium for the
Computer Interchange of Museum Information,簡稱 CIMI) 。CIMI 之宗旨為:將博物館資訊普及
社會大眾,推展開放式的系統標準(如:Z39.50),以管理及傳遞數位博物館資訊。自 1990 年
成立以來,CIMI 在博物館數位化資料架構的研究上,已有相當的進展。現今參與 CIMI 的會員
有二十多個單位,其中不乏相當知名的大型博物館或是數位博物館計畫。我國國科會「數位博
物館專案計畫」亦於 1999 年加入 CIMI,成為其會員。
2.工作重點
CIMI 目前的工作重點有五方面,主要目的在於建立數位博物館資訊的普及性,並發展健全的管
理體系以做為永續經營的基礎。
(1)整合資訊管理:CIMI 目前正在研擬如何就不同機構的資源層次,提供不同的使用工具與標
準,以使各機構能依其需要、按其預算,發展他們自己資訊管理的整合體系。
(2)資源發現與探索:CIMI 早期工作的重點大多在建立資訊架構的標準,以利使用者以電子方式
取得。目前 CIMI 方針已邁入研擬檢索資訊的標準及方法。
(3)分散式的搜尋與檢索:CIMI 目前進行測試的方式,在網路中之搜尋檢索功能將不亞於一個在
本館的系統。
(4)標準化的磋商:標準若要成為真正的標準,必須具有強烈的共識。透過仔細的協商與嚴謹的
實驗,致力推動「文化遺產」相關單位對電子資訊標準的共識。
(5)配合國際發展:全球有許多團體也在研發資訊交換的標準。CIMI 與這些團體保持連繫,並致
力配合國際的相關發展。
3. 描述主題與描述資料類型
CIMI 的架構主要落實在 CHIO 中,CHIO 的目的是要為博物館的藏品建立著錄標準,共有一萬
筆以上的民俗藝術資訊,包括展覽目錄、牆上標籤、物件記錄、影像、書目記錄、展覽指南、
權威資料等,據以建立一套線上檢索系統。
30. 4. 系統架構
(1)CHIO Structure:使用 SGML 標誌全文資料、影像資料、牆上說明、展覽目錄,設計出博物館資料所需的 CIMI
DTD。
(2)CHIO Access:探討利用 Z39.50 做資料庫的查詢與檢索,在系統的檢索上,CHIO 有三種檢索方式,Quick
Search、Concept Search、Focused Search,分別支援不同的欄位檢索。
5. 資訊描述項目
CIMI 的資訊描述項目是 CIMI access points, 在 CIMI Z39.0 profile。中則稱為 CIMI-1 Attribute
set,包括 CHIO access points 與其他相關項目。CHIO access points 則是被涵蓋在 CIMI access point
中。CHIO access points,描述了文件的重點,也是使用者在查詢檢索文件時所用的檢索點 。
CHIO access points 採用了 CDWA (categories for the Description of works of Art)與 CIDOC model
的描述項目,CHIO access points 包括:award、bibliography、concept、context、context-
archaeological、context-archaeological、context-archaeological、context-architectural、context-
historical、copyright. restrictions、creation、creator、credit-line、current-location、date-
range、event、identity、identity-number、inscription.mark、materials-and-
techniques、material、nationality. culture.race、object.
work、occupation、organization、ownership、person、place、process. technique、quote、styles-
movements、subject、subject-description、subject. identification、subject-interpretation、title.
name、type. classification。這些 access points 正針對博物館資料的特性所設計的,能確實而詳細
描述出博物館資料的特徵。
6. 語法規則
採用 SGML 語法。
7.應用計畫
CIMI 的架構與格式都實現在 CHIO 中,目前共有以下的機構利用 CIMI 處理其博物館資訊,包
括: Art Gallery of Nova Scotia、Canadian Museum of Civilization)、Museum Informatics
Project)、Museum D'Orsay)、 (National Gallery of Art、National Museum of American Art)。
8.未來發展