Presentation on Linked Open Data with a focus on the Records in Contexts Ontology (RiC-O) held at the 25th Archivwissenschaftliches Kolloquium, Archivschule Marburg (Germany).
Presentation in German
1. Linked (Open) Data in der Praxis:
Records in Contexts - Ontology
25. Archivwissenschaftliches Kolloquium
Kerstin Arnold, 8. Juni 2021
Hintergrundbild: The Linked Open Data Cloud, Stand zum 5. Mai 2021; https://lod-cloud.net/ ( )
2. Tim Berners-Lee: 15 Jahre danach
2
Linked (Open) Data in der Praxis Kerstin Arnold, 8. Juni 2021
4. Vier Regeln zu Linked Data
● URIs (Uniform Resource Identifier) als Namen der Dinge
● HTTP URIs, um diese Namen anzusteuern
● Zusätzliche Informationen verfügbar beim Ansteuern dieser Namen
○ Formuliert in Standardformaten (RDF, SPARQL)
● Weitere URIs, um mehr Dinge zu entdecken
4
Linked (Open) Data in der Praxis Kerstin Arnold, 8. Juni 2021
5. Fünf Sterne für Linked Open Data
Im Web verfügbar und unter einen offenen Lizenz freigegeben
In einem maschinenlesbaren, strukturierten Datenformat
In einem nicht herstellergebundenen Datenformat
Unter Verwendung der W3C-Standards zur Identifikation der Dinge
Mit Links zu anderen Dingen zur Kontextualisierung
5
Linked (Open) Data in der Praxis Kerstin Arnold, 8. Juni 2021
✩
✩✩✩
✩✩
✩✩✩✩
✩✩✩✩✩
6. Die Evolution des Webs
6
Linked (Open) Data in der Praxis Kerstin Arnold, 8. Juni 2021
7. Vom World Wide Web zu "Web 2.0"
7
Linked (Open) Data in der Praxis Kerstin Arnold, 8. Juni 2021
HTML, HTTP/HTTPS URIs
8. Vom World Wide Web zu "Web 2.0"
8
Linked (Open) Data in der Praxis Kerstin Arnold, 8. Juni 2021
Python, Ruby, PHP, JavaScript, etc.
Cloud Computing
Suchmaschinen User Generated Content
Social Media
9. Den Dingen eine Bedeutung geben
● Begrifflichkeiten
○ Semantic Web
○ Linked Open Data
○ Web of Data
○ Web 3.0
■ Als Kombination von "Web 2.0" und Semantic Web
○ Giant Global Graph (GGG)
9
Linked (Open) Data in der Praxis Kerstin Arnold, 8. Juni 2021
10. Den Dingen eine Bedeutung geben
10
Linked (Open) Data in der Praxis Kerstin Arnold, 8. Juni 2021
URI URI
URI URI
URI URI
URI
URI
URI
RDF
URI
11. Die Beschreibung von Ressourcen
● Resource Description Framework (RDF)
○ 4ter Stern: Verwendung von W3C-Standards (siehe https://www.w3.org/RDF/)
○ Beschreibung von Ressourcen in Tripeln bzw.
"Subjekt"-"Prädikat"-"Objekt"-Aussagen
■ "Friedrich von Thiersch" "wurde geboren in" "Marburg"
■ "Friedrich von Thiersch" "wurde geboren am" "18. April 1852"
■ "Friedrich von Thiersch" "war von Beruf" "Architekt"
■ "Friedrich von Thiersch" "entwarf" "Münchner Justizpalast"
11
Linked (Open) Data in der Praxis Kerstin Arnold, 8. Juni 2021
12. Die Beschreibung von Ressourcen
● Entscheidend
○ Beziehung, d.h. das Prädikat, zwischen Subjekt und Objekt wird selbst eine
Ressource betrachtet
○ Subjekt und Prädikat sind immer Ressourcen
○ Objekt kann Ressource oder Literal sein
○ Ressourcen werden immer mittels URIs identifiziert
○ Ein (semantisches) Netz entsteht, wenn sich verschiedene Tripel auf dieselben
Subjekte bzw. Objekte beziehen
12
Linked (Open) Data in der Praxis Kerstin Arnold, 8. Juni 2021
13. Die Beschreibung von Ressourcen
13
Linked (Open) Data in der Praxis Kerstin Arnold, 8. Juni 2021
Friedrich von
Thiersch
http://d-nb.info/gnd/118622005
18. April 1852
Marburg
http://d-nb.info/gnd/4037446-4
Architekt
http://d-nb.info/gnd/118622005
Martin Gropius
http://d-nb.info/gnd/118718967
Berlin
http://d-nb.info/gnd/4005728-8
Deutschland
http://d-nb.info/gnd/4011882-4
https://www.ica.org/standards/RiC/
ontology#birthDate
https://www.ica.org/standards/RiC/ontology
#isAssociatedWithPlace
https://www.ica.org/standards/RiC/ontology
#isAssociatedWithPlace
https://www.ica.org/standards/RiC/ontology
#hasOrHadOccupationOfType
https://www.ica.org/standards/RiC/ontology
#hasOrHadOccupationOfType
https://www.ica.org/standards/RiC/ontology
#isOrWasPartOf
https://www.ica.org/standards/RiC/ontology
#isOrWasPartOf
14. RDF
Repräsentation, Speicherung
und Abfrage
Textuelle Repräsentation oftmals in
XML
Gleichfalls vertreten sind Notation 3
(N3) und dessen Untermenge Turtle
Gespeichert in Triplestores
Teils neu entwickelt, teils auf existierenden
Datenbanken aufsetzend
Abfragen mit SPARQL
(W3C-Empfehlung)
14
15. "Eulenpost"
● Web Ontology Language (OWL)
○ Aufbauend auf RDF
○ Ermöglicht die Definition von (spartenspezifischen) Ontologien mit
■ Klassen ("classes") von Objekten bzw. Konzepten
■ Eigenschaften ("properties") dieser Klassen
■ Instanzen ("instances") als die einzelnen Dinge, die einer oder mehreren
Klassen zugehörig sind
15
Linked (Open) Data in der Praxis Kerstin Arnold, 8. Juni 2021
17. Vokabular und Regelwerk
● Records in Contexts - Ontology (RiC-O)
○ Formelle technische Repräsentation des Konzeptmodells
■ Eine mögliche Repräsentation, nicht zwingend die einzig mögliche
○ Verwendet OWL/RDF
○ Hauptziel: Definition des Vokabulars für archivische Metadaten sowie des
dazugehörigen Regelwerks zur Verwendung derselben in RDF-Datensätzen
■ Ermöglicht die Erstellung, Abfrage, Publikation und den Austausch solcher
Datensätze
17
Linked (Open) Data in der Praxis Kerstin Arnold, 8. Juni 2021
18. RiC-O Entwicklung
● Februar bis November 2019
○ Versand verschiedener Betaversionen an "Early reviewers"
● Dezember 2019
○ Veröffentlichung von RiC-O v0.1 mit Bitte um Kommentierung
○ Zusammen mit Entwurfsfassung von RiC-CM v0.2
● Februar 2021
○ Veröffentlichung von RiC-O v0.2
18
Linked (Open) Data in der Praxis Kerstin Arnold, 8. Juni 2021
19. RiC-O
Aktueller Stand
Allgemeiner Überblick (ICA):
https://www.ica.org/standards/RiC/
RiC-O_v0-2.html
GitHub Informationsseite:
https://ica-egad.github.io/RiC-O/index.html
Code, Beispiele, etc. in GitHub:
https://github.com/ICA-EGAD/RiC-O
19
20. Designanforderungen zu RiC-O
● Spartenspezifisch
○ Äquivalent der Archivwelt zum Library Reference Model (LRM) für Bibliotheken
und zum Comité International pour la Documentation Conceptual Reference
Model (CIDOC-CRM) für Museen
● Direkt anwendbar
● Nützlich
● Flexibel und erweiterbar
20
Linked (Open) Data in der Praxis Kerstin Arnold, 8. Juni 2021
21. Beispielgraph (Ausschnitt 1)
21
Linked (Open) Data in der Praxis Kerstin Arnold, 8. Juni 2021
Siehe https://github.com/ICA-EGAD/RiC-O/blob/master/diagrams/diagrams_v0-2/NationalArchivesOfFrance-examples/a-medieval-act-in-a-cartulary.jpg ( )
22. Beispielgraph (Ausschnitt 2)
22
Linked (Open) Data in der Praxis Kerstin Arnold, 8. Juni 2021
Siehe https://github.com/ICA-EGAD/RiC-O/blob/master/diagrams/diagrams_v0-2/NationalArchivesOfFrance-examples/a-medieval-act-in-a-cartulary.jpg ( )
23. Unterschiede von RiC-O im Vergleich zu RiC-CM
● Definition zusätzlicher Klassen
○ Präzisere Benennung
■ Z.B. <rico:Place>, <rico:PhysicalLocation> und <rico:Coordinates> für
RiC-E22 Place
○ Klassen für Komponente in RiC-CM, die dort nicht als Entität definiert sind,
denen aber in RiC-O Eigenschaften zugeordnet werden sollen bzw. bei denen eine
Verknüpfung mit anderen Vokabularen sinnvoll ist
■ Z.B. für <rico:Type>, <rico:Language>, <rico:Identifier> und <rico:Name>
23
Linked (Open) Data in der Praxis Kerstin Arnold, 8. Juni 2021
24. RiC-O in der Praxis
● Entscheidend
○ Es wird angenommen, dass kein Projekt und keine Institution RiC-O in vollem
Umfang nutzen wird.
○ Es wird als wahrscheinlicher angesehen, dass sie
■ nur einen Teil von RiC-O verwenden
■ RiC-O im Rahmen ihrer eigenen Anwendungen ergänzen, z.B. durch weitere
Unterklassen und Untereigenschaften.
24
Linked (Open) Data in der Praxis Kerstin Arnold, 8. Juni 2021
26. Cogito ergo sum
● Geplante und aktuelle Forschungsprojekte zu RiC
○ Belgien (Staatsarchiv, Königliche Bibliothek, Königliche Museen für Kunst und
Geschichte, Katholische Universität Leuven)
■ Proof-of-concept-Projekt zur Nutzung von RiC-CM und RiC-O als zentrales
Konzept- und Referenzmodell, um Verbindungen zwischen den
unterschiedlichen Daten der beteiligten Institutionen aufzuzeigen
■ Prüfung von Aufwand (für die Institutionen) und Nutzen (für die
Institutionen sowie ihre Benutzer)
26
Linked (Open) Data in der Praxis Kerstin Arnold, 8. Juni 2021
27. Cogito ergo sum
● Belgien (Doktorarbeit von Anne Chardonnens, Université libre de Bruxelles)
○ Siehe http://hdl.handle.net/2013/ULB-DIPOT:oai:dipot.ulb.ac.be:2013/315804
○ Wikibase Knowledge Base für das CegeSoma Forschungszentrum (Staatsarchiv,
Schwerpunkt "Konflikte des 20. Jahrhunderts") zum Management von Normdaten
zu Ressourcen und Personen im Kontext des Zweiten Weltkriegs
○ Prototyp verfügbar unter https://adochs.arch.be
○ Verfügbar in RDF und durchsuchbar via SPARQL
○ Mapping zwischen den Eigenschaften in dieser Knowledge Base und in RiC-O
27
Linked (Open) Data in der Praxis Kerstin Arnold, 8. Juni 2021
28. Cogito ergo sum
● Brasilien (Staatliche Universität Rio de Janeiro, LABOGAD)
○ Forschungsprojekt zum Thema "Atlantischer Sklavenhandel in Linked Open Data
Archiven"
○ Veröffentlichung und Vernetzung entsprechender archivischer Datensätze aus
Brasilien sowie - perspektivisch - aus Angola und Portugal mit Hilfe von
Semantic Web Technologien und formuliert in RiC-O
● Deutschland (SoNAR (IDH) Projekt)
○ Siehe https://sonar.fh-potsdam.de/
28
Linked (Open) Data in der Praxis Kerstin Arnold, 8. Juni 2021
30. In medias res
● Einbindung von RiC-O in bestehende Systeme
○ Frankreich (Nationalarchiv, Nationalbibliothek und Interministerieller Service für
Archive in Frankreich)
■ Erster Prototyp zu RiC-O: Polite d’Interopérabilité pour les Autorités
archvistiques françaises (PIAAF)
■ Launch im Februar 2018: https://piaaf.demo.logilab.fr
■ Konvertierung bestehender archivischer Metadaten nach RiC-O
■ Verknüpfung der Datensätze der beteiligten Institutionen
■ Neue Methoden zur Navigation und Visualisierung
30
Linked (Open) Data in der Praxis Kerstin Arnold, 8. Juni 2021
31. In medias res
31
Linked (Open) Data in der Praxis Kerstin Arnold, 8. Juni 2021
Mehr zu PIAAF im Vortrag von Florence Clavaud, Brüssel, 22. November 2019: http://adochs.be/wp-content/uploads/2020/01/LinkingThePast_Brussels_20191122_RecordsInContexts.pdf
32. In medias res
● Frankreich (nationales Portal FranceArchives, https://francearchives.fr/)
○ RiC-O als Referenzmodell für eine geplante RDF web app
○ Ziel: FranceArchives als Referenzportal für französische Archive mit
Linked Data
○ Zeitrahmen der Entwicklung: bis 2022/23
32
Linked (Open) Data in der Praxis Kerstin Arnold, 8. Juni 2021
33. In medias res
● Schweiz (Memoriav, Verein zur Erhaltung und die Erschließung des schweizerischen
audiovisuellen Kulturgutes)
○ Neue Version des Memobase-Portal (http://memobase.ch) unter Verwendung von
RiC-O
○ Kombination mit PREMIS und Ebucore für technische Metadaten
33
Linked (Open) Data in der Praxis Kerstin Arnold, 8. Juni 2021
34. In medias res
● Vereinigte Staaten von Amerika (Social Networks and Archival Context Cooperative,
SNAC, https://snaccooperative.org/)
○ Pläne zur Implementierung eines Subsets von RiC-O mit Blick auf Akteure,
Tätigkeitsbereiche, Orte und Archivobjekte
○ Überarbeitung der bestehenden Beziehungen in SNAC und Erweiterung durch
RiC-O-Beziehungen
34
Linked (Open) Data in der Praxis Kerstin Arnold, 8. Juni 2021
35. Deus ex machina
● RiC-O-basierte Werkzeuge
○ Frankreich (Nationalarchiv)
■ RiC-O-Konverter (https://github.com/ArchivesNationalesFR/rico-converter)
■ Mapping von EAD (2002) und EAC-CPF nach RiC-O
■ Bislang erfolgreich konvertiert:
● Alle EAD-Findbücher des Nationalarchivs (ca. 29,000 XML-Dateien)
● 15,000 EAC-CPF-Dateien
35
Linked (Open) Data in der Praxis Kerstin Arnold, 8. Juni 2021
36. Deus ex machina
● International (Stiftung Access To Memory)
○ Geplante neue Version von AtoM, AtoM3
○ Wird SPARQL-Endpunkt einschließen zur Publikation von
RiC-O-konformen archivischen Datensätzen
● Schweiz (docuteam, https://www.docuteam.ch/, und Zazuko, https://zazuko.com/)
○ In Entwicklung befindliche neue Software zur Beschreibung von Archivdaten
unter Nutzung von Semantic Web Technologien und formuliert in RiC-O
○ In Kombination mit PREMIS
36
Linked (Open) Data in der Praxis Kerstin Arnold, 8. Juni 2021
37. Vielen Dank für Ihre Aufmerksamkeit :-)
kerstin.arnold@archivesportaleurope.net / @kerstarno
Fragen?