Ein Persistent Identifier (PI) ist eine Methode zur eindeutigen Identifizierung von elektronischen Dokumenten jeglicher Art. In der Regel sind PI alphanumerische, systematisch aufgebaute Codes, die zum Beispiel einen bestimmten Zeitschriftenartikel, eine online-Ausgabe eines Buches, eine Multimediadatei, oder auch ein Digitalisat dauerhaft bezeichnen. Nützlich ist das deshalb, weil der klassische Zugang zu jenen digitalen Dokumenten über eine bestimmte Internetadresse (genannt URL – uniform ressource locator) nicht von Dauer ist. Die Internetadresse gibt lediglich den Standort des Dokuments an. Ändert sich dieser Standort (wird beispielsweise der Server eines Datenbankanbieters umstrukturiert und in diesem Zuge das Dokument an einem anderen Ort gelegt, oder vollkommen gelöscht), finden sich unter der alten Zugangsadresse keine Inhalte mehr (Stichwort: dead link). Die Adresse ist unbrauchbar. Konkret besteht die Problematik darin, dass der Endnutzer nichts von diesem Standortwechsel mitbekommt und sich nicht über die neue Adresse offiziell informieren kann, sondern selbst recherchieren muss, wo das Dokument jetzt zu finden ist und wie seine neue Adresse lautet. PI sollen das ändern.
2. Worum geht‘s?
-> Langzeitverfügbarkeit von elektronischen
Dokumenten
Klassischer Zugang über Aggregator-Datenbanken …
… via URL (uniform resource locator)
-> http:// […] .pdf
2Stefan Volkmann: PI, URI, DOI.
3. Problem
URLs nicht dauerhaft (persistent)!
Standortwechsel des Dokuments -> dead link
3Stefan Volkmann: PI, URI, DOI.
4. Lösung: PI - persistend identifier
• Trennung Identifikation und Standortadresse
– PI immer gleich
und eindeutig
– eingegeben in
einen
Resolver-Dienst
werden alle
Standorte
ausgegeben
URN Resolver der DNB
4Stefan Volkmann: PI, URI, DOI.
5. Beispiele für PI Systeme
URN – uniform resource name
• urn:nbn:de:101:1-201301259432
• urn:nbn:de:bvb:12-bsb10598338-1
• urn:isbn:3-8077-1017-5
DOI – digital object identifier
• doi:10.1149/1.3205062
• doi:10.1093/bib/bbn022
5Stefan Volkmann: PI, URI, DOI.
6. Zugehörigkeit und Aufbau
URI Schema: authority: ID
URL http:// domain/ pfad/ ... .pdf
http:// www.website.de/ dokumente/name.pdf
URN urn: Namensraum: Spezifizierung
urn: nbn: de:bvb:12-bsb10598338-1
urn: isbn: 3-8077-1017-5
DOI 10. authority/ ID
10. 1149/ 1.3205062
10. 1093/ bib/bbn022
6Stefan Volkmann: PI, URI, DOI.
7. URI
URN
URL
Auflösung – der Weg zum Dokument
DOI
Resolver
7Stefan Volkmann: PI, URI, DOI.
http://nbn-resolving.org/urn:nbn:de:gbv:089-2683311469
http://dx.doi.org/10.1149/1.3205062
8. ISOC:
IESO/IETF
IANA
Resolver-Datenbanken
URN – Internet
Engineering Task Force
(IETF) & Internet
Assigned Numbers
Authority (IANA)
DOI – International DOI
Foundation (IDF)
Resolver
1. gegen Beitrag
2. Organisations-ID
1. Antrag und
Anforderungserfüllung
2. Genehmigung
Zuletzt jeweils:
PI-Vergabe und
Standort-Pflege-PflichtResolver
8
Anbieter
Organisationen
Verlage
Bibliotheken
„registration
agencies“
der IDF
9. URN
• PI-Vergabe: hohe Anforderungen für
eigenen Namensraum, keine zentrale
Resolver-Datenbank
• Resolving-Bündelung u.a. durch DNB
• http://nbn-resolving.org/ urn:nbn:
• Auch für dt. Bibliotheken, die digitale
Inhalte Produzieren
• Hochschulschriftenserver OPUS
• Auflösung neben Dt. auch CZ, FI, HU, NL,
NO, SE
DOI
• Verwaltet von International DOI
Foundation (IDF)
• PI-Vergabe: Beitragszahlung, aber simpel
und effektiv, da Resolver-Datenbank bei
IDF
• gut für kleine Anbieter und Verlage
• Große dt. Kataloge – kaum DOI Integration
• Suchraumerweiterung durch
Kataloganreicherung von IDF-Metadaten
bisher nur für engl. Sprachraum
• Nur wenige dt. Bibliotheken aktiv
involviert
• Ausnahme : TIB – DataCite – DOI für
Forschungsdaten
9Stefan Volkmann: PI, URI, DOI.
http://dx.doi.org/10.1149/1.3205062http://nbn-resolving.org/
urn:nbn:de:gbv:089-2683311469
10. Relevanz für die Musikarchivierung?
DISMARC (discovering music archives)
• OAI-Harvester (open archives
initiative)
• Metadaten
• Link zu Audiodaten
• Integration in Europeana
• „Audio aggregation Portal“
• PI: oai:eu.dismarc:<ID>
10Stefan Volkmann: PI, URI, DOI.
11. Resumé
• Viel unterschiedliche PI Initiativen
– Resolver-Dienste inkonsequent verteil
• tw. hoher Aufwand, um zu aufgelösten
Standorten des Dokuments zu kommen
• Resolver-Dienste inkonsequent verteilt t;
sollten zentralisiert werden
– „Resolver Discovery System“
Stefan Volkmann: PI, URI, DOI. 11