Metadataschema's en inhoudelijke ontsluiting

Metadataschema’s en
inhoudelijke ontsluiting
Piet de Keyser
2013

Waarom?
 Interesse voor metadataschema’s
 Weinig of niet voor de inhoudelijke
ontsluiting daarin

Vroeger…
 Titelbeschrijving volgens …
 Inhoudelijke ontsluiting?
Trefwoorden?
 Vaak geen => “known item search”
 Vaak vrije
 Grote talen: wel systemen, bv. LCSH

1970 - 1990
 ISBD – MARC
= formaten voor professionelen
 Trefwoorden:
 Ook voor kleinere taalgebieden
 “Handboek trefwoorden” : 1979
 Maar: 1ste
zin voorwoord !!
 Thesauri voor speciale bibliotheken

Vanaf jaren ‘90
 Concurrentie van andere formaten
 Formaten ook voor niet-
professionelen / buiten bibliotheken
 Inhoudelijke ontsluiting lijkt minder
belangrijk
 Automatische full text indexering
 Keywords van zoekmachines
 Opgang XML -> uitwisseling tussen
formaten

Begin 21ste
eeuw
 Aandacht voor ontologieën
 < Semantic Web
 Ontologieën -> linked data
 Héél andere relaties dan in klassieke
instrumenten (bv. thesauri):
 “heeftIngrediënt” / “heeftSalarisschaal”
 >< thesauri: BT, NT, RT
 >< trefwoorden: zie, zie ook

Metadataformaten
 MARC21
 Dublin Core
 ETD-MS
 TEI
 METS
 MODS
 GEM / LOM
 ONIX
 CDWA / VRA

MARC21
machine readable cataloging
 Velden 6XX -> 15 velden
 Maar ook
 Velden 0XX -> ook méér dan 10
 Bv. 080 - UDC
 Bv. 082 – DDC
 Héél gestructureerd via
 Subvelden
 Indicatoren

MARC21
 Daarnaast:
 Speciaal formaat voor authority records
 Speciaal formaat voor classificaties
 Dus: structuur !, maar:
 Structuur ≠ gecontroleerd
 Bv. Libis-net:
 690 38 a
5 Vt
 Filosofie van 9-(sub)velden

MODS
metadata object description schema
 = MARC in XML
 Met MADS als authority format
 Ook Lite-versie: 15 DC velden
 Woorden i.p.v. getallen voor velden
 Leesbaarder
 Ook leesbaarder van MARCXML

MODS
 Voorbeeld trefwoord:
<subject authority="lcsh">
<topic>Journalism</topic>
<topic>Political aspects</topic>
<geographic>United States.
</geographic>
</subject>

MODS
 Voorbeelden classificatie-codes:
<classification
authority="lcc"> PN4888.P6 A48
1999 </classification>
<classification edition="21"
authority="ddc">071/.3
</classification>

DC
Dublin Core
 Oorspronkelijk 15 velden
 Belangrijkste inhoudelijke ontsluiting =
Subject
 Maar ook: Coverage
 Ondertussen: uitbreiding naar
“terms”

DC Subject
“Typically, the subject will be
represented using keywords,
key phrases, or classification
codes. Recommended best
practice is to use a
controlled vocabulary.”

DC vocabulary encoding schemes
o.a.
- DDC
- LCC
- UDC
- LCSH
- MeSH
- TGM

DC Subject: verdere evolutie
 Maar: nota bij Subject als “term”:
“This term is intended to be used
with non-literal values as defined
in the DCMI Abstract Model. As of
December 2007, the DCMI Usage Board
is seeking a way to express this
intention with a formal range
declaration.”
=> Tendens tot formaliseren + linken aan
gecontroleerde vocabulaires

ETD-MS
 Metadata Standard for Electronic
Theses and Dissertations
 Populair in eindwerkenrepositories
 Leunt erg aan bij DC
 dc.subject
 dc.coverage

TEI
text encoding initiative
 In feite codering hele document
 Cf. HTLM
 Metadata -> header
 Mogelijkheden:
 Keywords
 Termen gecontroleerde vocabulaires
 Classificatiecodes

Schema’s leerobjecten
bijv. LOM (Learning Object Metadata)
 In sectie “general” o.a.
 Keywords -> vrije trefwoorden
 Coverage
 In sectie “classification”
 Meer gestructureerd
 Allerlei classificaties mogelijk

CDWA
 Categories for de Description of
Works of Art
 Ca. 380 velden < complexiteit
kunstvoorwerken

CDWA
 Onder andere:
SUBJECT MATTER
- Subject Display
- General Subject Terms
- General Subject Type
- General Subject Extent
- Specific Subject Terms
- Specific Subject Type
- Specific Subject Extent
- Outside Iconography Term
- Outside Iconography Code
- Subject Interpretive History
- Remarks
- Citations
- Page

VRA
 Visual Resources Association Core
Categories
 17 velden -> o.a. Subject
 “proper names”, “geographic
designations”, “generic terms”, etc.
 Gecontroleerde vocabulaires zijn
aangeraden: AAT, TGM, ICONCLASS
 Dus: minder gestructureerd dan
CDWA

Gevolgen
 Veelheid aan formaten
 Sommige erg gestructureerd
 Sommige minder gestructureerd
 Omzettingen
 Rijk -> arm: CDWA -> DC
 Arm -> rijk: DC -> MARC21
 Crosswalks: bijv. MARC/DC ,CDWA

Eenheidscatalogi: bv.Unicat
 Een geschiedenis van België / Marc Reynebeau ->
keywords
332 --- België --- geschiedenis ---
#GGSB: Geschiedenis (Belgie) ---
#KVHA:Geschiedenis; Belgie ---
geschiedenis --- België --- 931 --- 931
--- 1830 - 2005 --- België ---
Geschiedenis --- Ontstaan --- 94(493) ---
C8 --- geschiedenis ---
België [land in werelddeel Europa] ---
E070309.jpg ---
België: geschiedenisgeschiedenis van België -
--- Inleidingen - Hand- en leerboeken
--- Ideologie en politiek

Gevolgen
 DC -> heel belangrijk bij open
archives
 Harvesters:
 Bv. Narcis: geen velden
 Bv. Oaister: “Trefwoorden:”
 Zeer ruim
 Bv. Scholar Google: geen “subject:”
 => keywords

Invloed metadataschema’s op
 Positief
 Structureren informatie -> velden
=> In principe: gericht zoeken
 Bepalen soms expliciet dat
gecontroleerd vocabulaires gebruikt
(zouden) moeten worden

Invloed metadataschema’s op
 Negatief
 Gericht zoeken? => in praktijk: alleen
“keywords”
 Belangrijkste, nl. DC, laat zeer veel / te
veel ? vrijheid

Nabije toekomst
 Semantic Web
 Linked data
 Rol metadata en inhoudelijke
ontsluiting?

Semantic Web
 Alleen ontologieën als instrument
inhoudelijke ontsluiting?
 Oorspronkelijk wel -> nu ook
waarde ingezien van “vocabularies”

Semantic Web en “vocabulaires”
“At times it may be important or
valuable to organize data. Using
OWL (to build vocabularies, or
“ontologies”) and SKOS (for
designing knowledge organization
systems) it is possible to enrich
data with additional meaning, which
allows more people (and more
machines) to do more with the
data.”

SKOS
 Simple Knowledge Organization System
 “SKOS is an area of work developing
specifications and standards to
support the use of knowledge
organization systems (KOS) such as
thesauri, classification schemes,
subject heading systems and
taxonomies within the framework of
the Semantic Web.”

SKOS
<madsrdf:authoritativeLabel
xml:lang="en">Ostend (Belgium)
</madsrdf:authoritativeLabel>
<rdfs:label xml:lang="en"
xmlns:rdfs="http://www.w3.org/2000/01/rdf-
schema#">Ostend (Belgium)</rdfs:label>
</madsrdf:Geographic>
<madsrdf:Topic
rdf:about="http://id.loc.gov/authorities/s
ubjects/sh85061212">
<rdf:type
rdf:resource="http://www.loc.gov/mads/rdf/
v1#Authority"/>

Conclusies
 Inhoudelijke ontsluiting met
traditionele instrumenten kan
belangrijk zijn
 Trefwoordsystemen
 Thesauri
 Classificaties
 Voorwaarden =>

Conclusies
 Voorwaarden
 Duidelijk aangeven wat wat is in
metadata
 Niet te veel ruimte voor vrije
trefwoorden
 Authority files -> publiek maken
 Ook belangrijk voor RDA !
 Compatible met SKOS

Metadataschema's en inhoudelijke ontsluiting

Empfohlen

Empfohlen

Weitere ähnliche Inhalte

Ähnlich wie Metadataschema's en inhoudelijke ontsluiting

Ähnlich wie Metadataschema's en inhoudelijke ontsluiting (20)

Mehr von Vlaamse Vereniging voor Bibliotheek, Archief & Documentatie vzw (VVBAD)

Mehr von Vlaamse Vereniging voor Bibliotheek, Archief & Documentatie vzw (VVBAD) (20)

Metadataschema's en inhoudelijke ontsluiting