2. Waarom?
Interesse voor metadataschema’s
Weinig of niet voor de inhoudelijke
ontsluiting daarin
3. Vroeger…
Titelbeschrijving volgens …
Inhoudelijke ontsluiting?
Trefwoorden?
Vaak geen => “known item search”
Vaak vrije
Grote talen: wel systemen, bv. LCSH
4. 1970 - 1990
ISBD – MARC
= formaten voor professionelen
Trefwoorden:
Ook voor kleinere taalgebieden
“Handboek trefwoorden” : 1979
Maar: 1ste
zin voorwoord !!
Thesauri voor speciale bibliotheken
5. Vanaf jaren ‘90
Concurrentie van andere formaten
Formaten ook voor niet-
professionelen / buiten bibliotheken
Inhoudelijke ontsluiting lijkt minder
belangrijk
Automatische full text indexering
Keywords van zoekmachines
Opgang XML -> uitwisseling tussen
formaten
6. Begin 21ste
eeuw
Aandacht voor ontologieën
< Semantic Web
Ontologieën -> linked data
Héél andere relaties dan in klassieke
instrumenten (bv. thesauri):
“heeftIngrediënt” / “heeftSalarisschaal”
>< thesauri: BT, NT, RT
>< trefwoorden: zie, zie ook
8. MARC21
machine readable cataloging
Velden 6XX -> 15 velden
Maar ook
Velden 0XX -> ook méér dan 10
Bv. 080 - UDC
Bv. 082 – DDC
Héél gestructureerd via
Subvelden
Indicatoren
9. MARC21
Daarnaast:
Speciaal formaat voor authority records
Speciaal formaat voor classificaties
Dus: structuur !, maar:
Structuur ≠ gecontroleerd
Bv. Libis-net:
690 38 a
5 Vt
Filosofie van 9-(sub)velden
10. MODS
metadata object description schema
= MARC in XML
Met MADS als authority format
Ook Lite-versie: 15 DC velden
Woorden i.p.v. getallen voor velden
Leesbaarder
Ook leesbaarder van MARCXML
13. DC
Dublin Core
Oorspronkelijk 15 velden
Belangrijkste inhoudelijke ontsluiting =
Subject
Maar ook: Coverage
Ondertussen: uitbreiding naar
“terms”
14. DC Subject
“Typically, the subject will be
represented using keywords,
key phrases, or classification
codes. Recommended best
practice is to use a
controlled vocabulary.”
16. DC Subject: verdere evolutie
Maar: nota bij Subject als “term”:
“This term is intended to be used
with non-literal values as defined
in the DCMI Abstract Model. As of
December 2007, the DCMI Usage Board
is seeking a way to express this
intention with a formal range
declaration.”
=> Tendens tot formaliseren + linken aan
gecontroleerde vocabulaires
17. ETD-MS
Metadata Standard for Electronic
Theses and Dissertations
Populair in eindwerkenrepositories
Leunt erg aan bij DC
dc.subject
dc.coverage
18. TEI
text encoding initiative
In feite codering hele document
Cf. HTLM
Metadata -> header
Mogelijkheden:
Keywords
Termen gecontroleerde vocabulaires
Classificatiecodes
19. Schema’s leerobjecten
bijv. LOM (Learning Object Metadata)
In sectie “general” o.a.
Keywords -> vrije trefwoorden
Coverage
In sectie “classification”
Meer gestructureerd
Allerlei classificaties mogelijk
20. CDWA
Categories for de Description of
Works of Art
Ca. 380 velden < complexiteit
kunstvoorwerken
21. CDWA
Onder andere:
SUBJECT MATTER
- Subject Display
- General Subject Terms
- General Subject Type
- General Subject Extent
- Specific Subject Terms
- Specific Subject Type
- Specific Subject Extent
- Outside Iconography Term
- Outside Iconography Code
- Subject Interpretive History
- Remarks
- Citations
- Page
22. VRA
Visual Resources Association Core
Categories
17 velden -> o.a. Subject
“proper names”, “geographic
designations”, “generic terms”, etc.
Gecontroleerde vocabulaires zijn
aangeraden: AAT, TGM, ICONCLASS
Dus: minder gestructureerd dan
CDWA
23. Gevolgen
Veelheid aan formaten
Sommige erg gestructureerd
Sommige minder gestructureerd
Omzettingen
Rijk -> arm: CDWA -> DC
Arm -> rijk: DC -> MARC21
Crosswalks: bijv. MARC/DC ,CDWA
25. Gevolgen
DC -> heel belangrijk bij open
archives
Harvesters:
Bv. Narcis: geen velden
Bv. Oaister: “Trefwoorden:”
Zeer ruim
Bv. Scholar Google: geen “subject:”
=> keywords
26. Invloed metadataschema’s op
inhoudelijke ontsluiting
Positief
Structureren informatie -> velden
=> In principe: gericht zoeken
Bepalen soms expliciet dat
gecontroleerd vocabulaires gebruikt
(zouden) moeten worden
27. Invloed metadataschema’s op
inhoudelijke ontsluiting
Negatief
Gericht zoeken? => in praktijk: alleen
“keywords”
Belangrijkste, nl. DC, laat zeer veel / te
veel ? vrijheid
30. Semantic Web
Alleen ontologieën als instrument
inhoudelijke ontsluiting?
Oorspronkelijk wel -> nu ook
waarde ingezien van “vocabularies”
31. Semantic Web en “vocabulaires”
“At times it may be important or
valuable to organize data. Using
OWL (to build vocabularies, or
“ontologies”) and SKOS (for
designing knowledge organization
systems) it is possible to enrich
data with additional meaning, which
allows more people (and more
machines) to do more with the
data.”
32. SKOS
Simple Knowledge Organization System
“SKOS is an area of work developing
specifications and standards to
support the use of knowledge
organization systems (KOS) such as
thesauri, classification schemes,
subject heading systems and
taxonomies within the framework of
the Semantic Web.”
34. Conclusies
Inhoudelijke ontsluiting met
traditionele instrumenten kan
belangrijk zijn
Trefwoordsystemen
Thesauri
Classificaties
Voorwaarden =>
35. Conclusies
Voorwaarden
Duidelijk aangeven wat wat is in
metadata
Niet te veel ruimte voor vrije
trefwoorden
Authority files -> publiek maken
Ook belangrijk voor RDA !
Compatible met SKOS