1. Anet, WorldCat en Open Data:
kaleidoscopisch perspectief op metadata
Jan Corthouts
Informatie aan zee
18 september 2015
2. Webstrategie
• Diversiteit van Anet partners = diversiteit van webstrategieën
• Eigen content zo zichtbaar als mogelijk maken
• Online catalogus
• Collectieve catalogi
• Antilope
• UniCat
• STCV en Abraham (via VEB)
• WorldCat
• Art Libraries Group Catalogue
• Discovery systemen
• Levering metadata in MARCXML
• Platform onafhankelijk
• EDS voor UAntwerpen, KdG, AP
• Summon voor UHasselt
• Institutional repository
• Zichtbaarheid van wetenschappelijke output d.m.v.
• Harvesting van metadata OAI-PMH
• Indexering van metadata in search engines m.b.v. schema.org microtags
3. Discovery@UAntwerpen
• Respons van gebruikers
• Gebruikscijfers okt-2013 juni 2015
• Online bevraging
• EDS wordt goed gebruikt
• Gebruikers zijn tevreden
• Korte sessies
• Snel iets opzoeken
• Ondermaats gebruik van geavanceerde opties (zoeken met
wildcards, zoekgeschiedenis bewaren, exporteren, …)
3
4. Discovery@UAntwerpen
• EDS
• is niet DE bron
• is EEN bron tussen andere bronnen
• Voorkeur van gebruiker
4
Google (Scholar)
Discovery Service
Vakspecifieke
databanken
Web of Science
PubMed
9. Webstrategie
• Online catalogus overbodig?
• Ja (misschien) voor universiteitsbibliotheek
• EDS-UAntwerpen: online catalogus is best gebruikte
databank
• Nee (allicht) voor
• Erfgoedbibliotheek: goede metadata noodzakelijk i.f.v.
identificatie en digitalisering
• Museumbibliotheek: ontsluiting m.b.v. AAT, apparaat
waarmee de conservatoren vertrouwd zijn
• Specifieke collecties zoals tentoonstellingscatalogi,
veilingcatalogi, oude drukken, partituren, …
10. Webstrategie
• Kwaliteit van metadata
• Hoe onze lokale metadata verrijken / beter
contextualiseren
• Gebruik van wat beschikbaar is
• Open Data
• Twee terreinen
• Catalografgische records
• Authority records
11. Open Data
• Publicatie van eigen metadata
• File dump MARC Antilope catalogus
• OAI-PMH (harvesting metadata)
• MARC XML (catalogus)
• EAD XML (ISAD archiefbeschrijvingen)
• EAC XML (ISAAR archiefactoren)
• DC XML (erfgoedobjecten)
• OAI-DC (repository)
• Z39.50 server
• Overname externe metadata in eigen toepassingen
• Z39.50 client in catalografie
• Overname/updating AAT thesaurus termen
• Individueel
• In bulk
12. OCLC WorldCat
Overeenkomst Anet – OCLC
Financiering door UAntwerpen en Stad Antwerpen
Levering metadata aan OCLC
Zichtbaar in worldcat.org
Deep link naar online catalogus Anet
Operationeel 1/1/2015
Overeenkomst heeft enkel betrekking op worldcat.org
NIET op copy cataloguing
13.
14.
15.
16. Open Data via OCLC
Na opladen ontvangt Anet concordantietabel
Anet recordid versus OCLC recordid
OCLC recordid wordt toegevoegd
17. Verrijking eigen metadata
• Vertrekkend van OCLC recordid
• Twee terreinen
• Catalografische records
• Authority records
22. WorldCat Works
WorldCat Works
197 miljoen beschrijvingen van werken
.… authoritative work descriptions for bibliographic
resources found in WorldCat, bringing together multiple
manifestations of a work into one logical authoritative entity
…
Work URI’s zijn persistent
Open Data licentie ODC-BY
23. WorldCat Works
Uitgewerkte procedure
• Automatisch processen
• Proces 1: bevraging WorldCat
• Heeft record een OCLC nummer maar geen WorkID?
• Work ID wordt opgehaald en weggeschreven
• Proces 2: bevraging OCLC Work
• Opbouw van een afzonderlijke catalogus met metadata
OCLC Works in zoverre relevant voor Anet
• Proces 3:
• Tussen catalogus record en overeenkomstig Work record
wordt een relatie gelegd
26. Authority records in Anet
• Eigen authority records verrijken met interne en externe
identifiers
• Betere identificatie
• Betere contextualisering
• Levensdata
• Situeringen
• Samenbrengen van bibliotheek en archief metadata
• Voorbeelden van authority records in Brocade
• Personen
• Organisaties
• Geografische omschrijvingen
• Kunstwerken
27. VIAF
• The VIAF® (Virtual International Authority File) combines
multiple name authority files into a single OCLC-hosted
name authority service. The goal of the service is to
lower the cost and increase the utility of library authority
files by matching and linking widely-used authority files
and making that information available on the Web.
• http://viaf.org
28. VIAF
• Probleemstelling
• OCLC record bevat naam gekoppeld aan VIAF identifier
• Anet record bevat naam gekoppeld aan lokale identifier
• Anet hanteert thans geen VIAF identifier
• Zoek, vertrekkend van een specifieke titel, voor de naam
in Anet een VIAF recordnummer dat met deze naam
overeenstemt
• Naamsvormen zoals gehanteerd in Anet zijn niet
identiek aan naamsvormen gehanteerd door WorldCat
29. VIAF
• Jaro–Winkler distance
• is a measure of similarity between two strings.
• is designed and best suited for short strings such as
person names.
• The score is normalized such that 0 equates to no
similarity and 1 is an exact match
https://en.wikipedia.org/wiki/Jaro%E2%80%93Winkler_distance
30. VIAF
jwindex stringa stringb
80 JACOBUS DE VARAGGIO Jacobus
80 RAES KOEN Raes, K.
84 Fierens, Alfons Fierens, Alphonse
87 ALENE Alene, Ludwig
87 SABBE ETIENNE Sabbe, Etienne Émile Maria
92 Gaidoz, H. Gaidoz, Henri
92 Gautier, Théophile Gautier, Theophile
92 Gerven, van, Walter Van Gerven, W.
92 Gieck, Kurt Gieck, K.
92 Gilliodts-Van Severen, Louis Gilliodts van Severen, Louis
92 Giraudoux, Jean Giraudoux, Jean-Pierre
92 Glucksmann, A. Glucksmann, André
92 Golding, William G. Golding, William
92 Goscinny, René Goscinny, ..
92 Grauhan, Rolf Richard Grauhan, Rolf-Richard
92 Grinten, van der, Wim Grinten, W. C. L. van der
92 Grinten, van der, Wim Grinten, W.C.L. van der
92 HAEGENDOREN VAN MAURITS Haegendoren, M. van
92 HERCKENRATH ADOLF Herckenrath, Adolf Polydoor
92 Haegendoren, van, Maurits Haegendoren, M. van
92 Hakenbeck, Regine Hakenbeck, R.
92 Herckenrath, Adolf Herckenrath, Adolf Polydoor
92 ITTERBEEK VAN EUGENE Itterbeek, Eugéne van
92 ITTERBEEK VAN EUGENE Van Itterbeek, Eugène
92 Janssen, Tjitte H. Janssen, T. H.
92 Jensen, Stefan Jensen, Stefan N.
92 KILIAAN CORNELIS Kiel, Cornelis
92 KLOOS WILLEM [MEVR ] Kloos, Willem
31. VIAF
• Jaro–Winkler distance
• <80
• Buiten beschouwing
• 81-91
• Wacht
• >91
• Automatische toekenning VIAF nummer aan Anet
authority
• Inconsistenties
• Verschillende levensdata
• Multiple VIAF identifiers voor dezelfde persoon