SlideShare ist ein Scribd-Unternehmen logo
1 von 26
Downloaden Sie, um offline zu lesen
PREMIS in METS: Die beiden Datenmodelle
Matterhorn METS und Archivematica
Nestor-Praktikertag 2018: Metadaten für die digitale Langzeitarchivierung und
der Metadatenstandard PREMIS
Frankfurt am Main, 6. Juni 2018
Dr. Tobias Wildi, t.wildi@docuteam.ch
1
METS
2
Was ist METS? Und was ist ein METS-
Profil?
• METS = Metadata Encoding and Transmission Standard
Verwaltet durch die Library of Congress
http://www.loc.gov/standards/mets/
• METS ist ein Containerformat, welcher geeignet ist,
– um das Informationsmodell von OAIS abzubilden
– um Informationspakete zu serialisieren (systemunabhängig als eigenständige
Paket weiterzugeben)
• Die konkrete Umsetzung von METS lässt grosse Flexibilität zu. In einem «Profil»
wird im Detail beschrieben,
– wie METS verwendet wird,
– welche weiteren Standards eingebunden werden
– wie diese Standards aufeinander abgestimmt werden.
• http://www.loc.gov/standards/mets/mets-profiles.html
3
METS – Metadata Transmission and
Encoding Standard
4
Matterhorn METS-Profil
• Ist ein METS-Profil
• Basiert auf METS, EAD und PREMIS 2.2
• Ko-Entwicklung Staatsarchiv Wallis (CH) und docuteam.
• 2012 bei der Library of Congress registriert
http://www.loc.gov/standards/mets/profiles/00000041.xml
• Wird unterstützt durch die Open Source-Werkzeuge die docuteam für die
digitale Archivierung entwickelt (docuteam packer, docuteam feeder)
• Wird zunehmend auch als Ablieferungsformat genutzt und nicht durch
docuteam-Werkzeuge gebildet.
• Wird gegenwärtig weiterentwickelt zu «Matterhorn RDF», respektive
«IP new generation», was in der Schweiz eCH-0160 ablösen soll.
5
Matterhorn METS-Profil bildet das
OAIS-Informationsmodell ab
6
Representation Information
Data Object (Dateien)
Preservation Description Information
Descriptive Information
PREMIS
PREMSI
ISAD(G) à EAD
METS (Metadata Encoding
and Transmission Standard)
Container
Archivematica
7
• Artefactual Systems, Inc., Toronto.
• Artefactual ist mit Evelyn McLellan selber im PREMIS-Board vertreten
• Archivematica bezeichnet sich als «Core Preservation System»: Bewertung,
Ingest, Speicherung, Preservation Planning / Preservation Actions.
• Open Source (GPL3).
• Datenmodell basiert auf METS und Premis 2.2.
Dokumentation: https://wiki.archivematica.org/METS
PREMIS in METS
8
Library of Congress:
Using PREMIS with METS
• Library of Congress: «Guidelines for using PREMIS with METS for exchange
Revised September 17, 2008»
https://www.loc.gov/standards/premis/guidelines-premismets.pdf
• Library of Congress «Guidelines for using PREMIS with METS for exchange
Revised January 2017»
https://www.loc.gov/standards/premis/guidelines2017-premismets.pdf
Folgende Punkte werden geregelt:
1. Using PREMIS in METS sections
2. Use of PREMIS container
«Use of one amdSec with repeating subelements (techMD, etc.) or repeating
amdSec for each METS subelement is an implementer’s preference. These are
semantically equivalent»
3. Redundancies between PREMIS and METS
4. METS structMap and PREMIS structural relationship elements
5. METS ID/IDREF and PREMIS identifier elements
6. Use of METS profiles
9
Matterhorn METS – Einbetten von PREMISmets
metsHdr
dmdSec mdWrap EAD
amdSec digiprovMD mdWrap PREMIS
PREMIS:OBJECT
PREMIS:EVENT
PREMIS:AGENTfileSec
structmap
10
Eine einzige amdSec
für das gesamte
Informationspaket
Ein digiprovMD-
Block pro Objekt
Archivematica – Einbetten von PREMIS
mets
metsHdr
dmdSec
amdSec
techMD mdWrap PREMIS:OBJECT
digiprovMD mdWrap
PREMIS:EVENT
PREMIS:AGENT
fileSec
structmap
11
Eine amdSec pro Objekt
Matterhorn METS:
Eine amdSec für alle Objekte
12
Matterhorn METS
Ein digiprovMD-Block pro Objekt
• PREMIS-Informationen zu einem Ordner oder einer Datei werden je in einer
digiprovMD-Sektion zusammengefasst
13
Archivematica:
Eine amdSec pro Objekt
14
Archivematica:
techMD und digiprovMD
• techMD für PREMIS:OBJECT
• digiprovMD für PREMIS:EVENT, PREMIS:AGENT
15
Redundanzen
16
Redundanzen zwischen METS und PREMIS
LoC Implementation Guidelines:
«An implementer may decide whether it is easier to include the
information redundantly, based on how the data will be used and/or
supplied. Implementers should consider the use of the metadata
(e.g. display or preservation) and whether the METS (for display)
or PREMIS (for preservation) is primary when deciding which to
use and whether to record redundantly.»
17
Redundanzen: Beispiele
• Beispiel Fixity Information (Checksumme):
– <METS:file CHECKSUM=“[WERT]“ CHECKSUMTYPE=“[Wert]“>
– <PREMIS:fixity>
<messageDigestAlgorithm>
<messageDigest>
• Beispiel Dateiformat:
– <METS:file MIMETYPE=“[Wert]“>
– <PREMIS:formatDesignation>
<formatName>
<formatVersion>
• Entscheid bei Matterhorn METS:
– Fixity in PREMIS
– MIME-Type in METS (display), weiterführende Beschreibung von
Dateiformat und Version in PREMIS (preservation).
18
Events
19
Archivematica: Event
• Pro Event wird geschrieben:
– eventIdentifier
– eventType
– eventDateTime
– eventDetail
• eventOutcomeInformation
• eventOutcome eventOucomeDetail
– linkingAgentIdentifier
• linkingAgentIdentifierType
(eg. preservation system, repository code, Archivematica user)
• linkingAgentIdentifierValue
– kein linkingObjectIdentifier, der Event bezieht sich jeweils auf das Object in
der gleichen amdSec
20
Matterhorn METS: Event
• Pro Event wird geschrieben:
– eventIdentifier
– eventType (standardisiertes Vokabular, abgestimmt auf LoC-Vokabular)
– eventDateTime (Timestamp)
– eventDetail
(hier auch textliche Beschreibung des Akteurs)
– eventOutcomeInformation
• eventOutcome (success/failure)
• eventOucomeDetail
– linkingObjectIdentifier
• linkingObjetctIdentifierType
• linkingObjectIdentifierValue
21
Matterhorn METS: Event-Typen
• Die Event-Typen sind nicht Teil des METS-Profils. Verwendet werden folgende
Typen:
– Creation
– Rename
– Fixity Check
– Deletion
– Path Modification
– Migration
– Replace
• Ausser “Replace” handelt es sich um Event Types aus dem Standardvokabular
der Library of Congress:
http://id.loc.gov/vocabulary/preservation/eventType.html
22
Matterhorn METS: Event
23
Vergleich und Fazit
24
Archivematica und Matterhorn METS
Archivematica Matterhorn METS
PREMIS 2.2
PREMIS in METS eingebettet und nicht nur verlinkt
dezentralisiert:
- Eine amdSec pro Objekt
- Ein techMD-Block pro Objekt
- Ein digiprovMD-Block pro Event,
Agent
zentralisiert:
- Eine einzige amdSec pro Paket
- Ein digiprovMD-Block pro Objekt
kein registriertes METS-Profil METS-Profil:
http://www.loc.gov/standards/mets/profi
les/00000041.xml
Loglevel in Archivematica:
Detailliert, möglichst umfassende
technische Metadaten
Loglevel in docuteam feeder:
Soviel wie nötig als Grundlage für
Preservation Planning
25
Fazit
• In den beiden Modellen werden praktisch identische Informationen kodiert.
• Matterhorn METS zentral, Archivematica dezentralisiert.
• LoC: «Use of one amdSec with repeating subelements (techMD, etc.) or
repeating amdSec for each METS subelement is an implementer’s preference.
These are semantically equivalent»
• Dass unabhängig voneinander zwei Datenmodelle mit dieser hohen Ähnlichkeit
entwickelt wurde zeigt, dass
– die Standardisierungsdokumente hinreichend detailliert verfasst sind
– die Implementation Guidelines der LoC praxisorientiert, umsetzbar und klar formuliert
sind
• Am Vergleich von Archivematica und Matterhorn METS zeigt sich, dass ein
Produktwechsel zwar syntaktische Änderungen an den API nach sich ziehen
würde, die Semantik sich aber gleich bleibt.
26

Weitere ähnliche Inhalte

Was ist angesagt?

Bringing Digital Twins to life
Bringing Digital Twins to lifeBringing Digital Twins to life
Bringing Digital Twins to lifeJene van der Heide
 
Nti cs -as novas tecnologias da informação e comunicação
  Nti cs  -as novas tecnologias da informação e comunicação  Nti cs  -as novas tecnologias da informação e comunicação
Nti cs -as novas tecnologias da informação e comunicaçãoIranete Souza
 
Aula Mídia-educação
Aula   Mídia-educaçãoAula   Mídia-educação
Aula Mídia-educaçãoLaércio Góes
 
Ecossistemas de Software
Ecossistemas de SoftwareEcossistemas de Software
Ecossistemas de SoftwareRenato Pina
 
HL7 Fhir for Developers
HL7 Fhir for DevelopersHL7 Fhir for Developers
HL7 Fhir for DevelopersEwout Kramer
 
메타데이터 활용 사례
메타데이터 활용 사례메타데이터 활용 사례
메타데이터 활용 사례SSePhi
 
140-21_ANQEP-Atualiza_Ref_Comp-Web_FINAL_13Dez.pdf
140-21_ANQEP-Atualiza_Ref_Comp-Web_FINAL_13Dez.pdf140-21_ANQEP-Atualiza_Ref_Comp-Web_FINAL_13Dez.pdf
140-21_ANQEP-Atualiza_Ref_Comp-Web_FINAL_13Dez.pdfMarleneRicardo2
 
Xây dụng và kết hợp Kafka, Druid, Superset để đua vào ứng dụng phân tích dữ l...
Xây dụng và kết hợp Kafka, Druid, Superset để đua vào ứng dụng phân tích dữ l...Xây dụng và kết hợp Kafka, Druid, Superset để đua vào ứng dụng phân tích dữ l...
Xây dụng và kết hợp Kafka, Druid, Superset để đua vào ứng dụng phân tích dữ l...Đông Đô
 
Evaluating Drug Safety Using Graph Databases
Evaluating Drug Safety Using Graph DatabasesEvaluating Drug Safety Using Graph Databases
Evaluating Drug Safety Using Graph DatabasesNeo4j
 
Introduction to Omeka
Introduction to OmekaIntroduction to Omeka
Introduction to OmekaShawn Day
 
Slide ambientes virtuais de aprendizagem
Slide ambientes virtuais de aprendizagemSlide ambientes virtuais de aprendizagem
Slide ambientes virtuais de aprendizagemLissiane Maria Ribeiro
 
Metadata mapping
Metadata mappingMetadata mapping
Metadata mappingVlad Vega
 
Ambiente Virtual de Aprendizagem - AVA
Ambiente Virtual de Aprendizagem - AVAAmbiente Virtual de Aprendizagem - AVA
Ambiente Virtual de Aprendizagem - AVAcleyccc
 

Was ist angesagt? (18)

Bringing Digital Twins to life
Bringing Digital Twins to lifeBringing Digital Twins to life
Bringing Digital Twins to life
 
Curso Básico de JDBC
Curso Básico de JDBCCurso Básico de JDBC
Curso Básico de JDBC
 
Nti cs -as novas tecnologias da informação e comunicação
  Nti cs  -as novas tecnologias da informação e comunicação  Nti cs  -as novas tecnologias da informação e comunicação
Nti cs -as novas tecnologias da informação e comunicação
 
Aula Mídia-educação
Aula   Mídia-educaçãoAula   Mídia-educação
Aula Mídia-educação
 
Ecossistemas de Software
Ecossistemas de SoftwareEcossistemas de Software
Ecossistemas de Software
 
HL7 Fhir for Developers
HL7 Fhir for DevelopersHL7 Fhir for Developers
HL7 Fhir for Developers
 
메타데이터 활용 사례
메타데이터 활용 사례메타데이터 활용 사례
메타데이터 활용 사례
 
Metas de Aprendizagem na área das TIC
Metas de Aprendizagem na área das TICMetas de Aprendizagem na área das TIC
Metas de Aprendizagem na área das TIC
 
140-21_ANQEP-Atualiza_Ref_Comp-Web_FINAL_13Dez.pdf
140-21_ANQEP-Atualiza_Ref_Comp-Web_FINAL_13Dez.pdf140-21_ANQEP-Atualiza_Ref_Comp-Web_FINAL_13Dez.pdf
140-21_ANQEP-Atualiza_Ref_Comp-Web_FINAL_13Dez.pdf
 
SubProgramas
SubProgramasSubProgramas
SubProgramas
 
RDF data model
RDF data modelRDF data model
RDF data model
 
Xây dụng và kết hợp Kafka, Druid, Superset để đua vào ứng dụng phân tích dữ l...
Xây dụng và kết hợp Kafka, Druid, Superset để đua vào ứng dụng phân tích dữ l...Xây dụng và kết hợp Kafka, Druid, Superset để đua vào ứng dụng phân tích dữ l...
Xây dụng và kết hợp Kafka, Druid, Superset để đua vào ứng dụng phân tích dữ l...
 
Evaluating Drug Safety Using Graph Databases
Evaluating Drug Safety Using Graph DatabasesEvaluating Drug Safety Using Graph Databases
Evaluating Drug Safety Using Graph Databases
 
Introduction to Omeka
Introduction to OmekaIntroduction to Omeka
Introduction to Omeka
 
Modelos de Banco de dados e SGBDS
Modelos de Banco de dados e SGBDSModelos de Banco de dados e SGBDS
Modelos de Banco de dados e SGBDS
 
Slide ambientes virtuais de aprendizagem
Slide ambientes virtuais de aprendizagemSlide ambientes virtuais de aprendizagem
Slide ambientes virtuais de aprendizagem
 
Metadata mapping
Metadata mappingMetadata mapping
Metadata mapping
 
Ambiente Virtual de Aprendizagem - AVA
Ambiente Virtual de Aprendizagem - AVAAmbiente Virtual de Aprendizagem - AVA
Ambiente Virtual de Aprendizagem - AVA
 

Ähnlich wie PREMIS in METS: Die beiden Datenmodelle Matterhorn METS und Archivematica

Data Management im Zeitalter von Web 2.0 und Semantic Web
Data Management im Zeitalter von Web 2.0 und Semantic WebData Management im Zeitalter von Web 2.0 und Semantic Web
Data Management im Zeitalter von Web 2.0 und Semantic WebAndreas Schmidt
 
GraphTalks Hamburg - Semantic Data Management
GraphTalks Hamburg - Semantic Data ManagementGraphTalks Hamburg - Semantic Data Management
GraphTalks Hamburg - Semantic Data ManagementNeo4j
 
Herausforderungen im Datenmanagement von Metadaten
Herausforderungen im Datenmanagement von MetadatenHerausforderungen im Datenmanagement von Metadaten
Herausforderungen im Datenmanagement von MetadatenETH-Bibliothek
 
Dataservices - Data Processing mit Microservices
Dataservices - Data Processing mit MicroservicesDataservices - Data Processing mit Microservices
Dataservices - Data Processing mit MicroservicesQAware GmbH
 
Neo4j GraphTalks - Semantische Netze
Neo4j GraphTalks - Semantische NetzeNeo4j GraphTalks - Semantische Netze
Neo4j GraphTalks - Semantische NetzeNeo4j
 
GraphTalks Stuttgart - semantic data management – der Weg zu einer nachhaltig...
GraphTalks Stuttgart - semantic data management – der Weg zu einer nachhaltig...GraphTalks Stuttgart - semantic data management – der Weg zu einer nachhaltig...
GraphTalks Stuttgart - semantic data management – der Weg zu einer nachhaltig...Neo4j
 
1. intranda Goobi Tag: Vom Tool zum Trend
1. intranda Goobi Tag: Vom Tool zum Trend1. intranda Goobi Tag: Vom Tool zum Trend
1. intranda Goobi Tag: Vom Tool zum Trendintranda GmbH
 
Fit für Web 3.0 - Semantische Technologien
Fit für Web 3.0 - Semantische TechnologienFit für Web 3.0 - Semantische Technologien
Fit für Web 3.0 - Semantische TechnologienUrsulaDeriu
 
BizDataX - Data Masking Solution - Datamasking-Tool
BizDataX - Data Masking Solution - Datamasking-ToolBizDataX - Data Masking Solution - Datamasking-Tool
BizDataX - Data Masking Solution - Datamasking-ToolDragan Kinkela
 
Data model mal anders
Data model mal andersData model mal anders
Data model mal andersMaxim Zaks
 
Software Architecture Design Patterns der COMLINE Cloud Service Platform - CSP
Software Architecture Design Patterns der COMLINE Cloud Service Platform - CSPSoftware Architecture Design Patterns der COMLINE Cloud Service Platform - CSP
Software Architecture Design Patterns der COMLINE Cloud Service Platform - CSPChristian Guenther
 
Tech-Talk: iRods
Tech-Talk: iRodsTech-Talk: iRods
Tech-Talk: iRodsschlauch
 
TFF2023 - Navigating Tourism Data Nexus
TFF2023 - Navigating Tourism Data NexusTFF2023 - Navigating Tourism Data Nexus
TFF2023 - Navigating Tourism Data NexusTourismFastForward
 
Einführung in Metadatenverwaltung
Einführung in MetadatenverwaltungEinführung in Metadatenverwaltung
Einführung in MetadatenverwaltungOpen Data Support
 

Ähnlich wie PREMIS in METS: Die beiden Datenmodelle Matterhorn METS und Archivematica (20)

Data Management im Zeitalter von Web 2.0 und Semantic Web
Data Management im Zeitalter von Web 2.0 und Semantic WebData Management im Zeitalter von Web 2.0 und Semantic Web
Data Management im Zeitalter von Web 2.0 und Semantic Web
 
GraphTalks Hamburg - Semantic Data Management
GraphTalks Hamburg - Semantic Data ManagementGraphTalks Hamburg - Semantic Data Management
GraphTalks Hamburg - Semantic Data Management
 
Meatdaten
MeatdatenMeatdaten
Meatdaten
 
Herausforderungen im Datenmanagement von Metadaten
Herausforderungen im Datenmanagement von MetadatenHerausforderungen im Datenmanagement von Metadaten
Herausforderungen im Datenmanagement von Metadaten
 
SoSe 2013 | IT-Zertifikat: AMM - Digitale Bibliotheken, Metadatenstandards: M...
SoSe 2013 | IT-Zertifikat: AMM - Digitale Bibliotheken, Metadatenstandards: M...SoSe 2013 | IT-Zertifikat: AMM - Digitale Bibliotheken, Metadatenstandards: M...
SoSe 2013 | IT-Zertifikat: AMM - Digitale Bibliotheken, Metadatenstandards: M...
 
Dataservices - Data Processing mit Microservices
Dataservices - Data Processing mit MicroservicesDataservices - Data Processing mit Microservices
Dataservices - Data Processing mit Microservices
 
Fachkurs Online Content Management, FHNW
Fachkurs Online Content Management, FHNWFachkurs Online Content Management, FHNW
Fachkurs Online Content Management, FHNW
 
Neo4j GraphTalks - Semantische Netze
Neo4j GraphTalks - Semantische NetzeNeo4j GraphTalks - Semantische Netze
Neo4j GraphTalks - Semantische Netze
 
Cmis Phpug
Cmis PhpugCmis Phpug
Cmis Phpug
 
GraphTalks Stuttgart - semantic data management – der Weg zu einer nachhaltig...
GraphTalks Stuttgart - semantic data management – der Weg zu einer nachhaltig...GraphTalks Stuttgart - semantic data management – der Weg zu einer nachhaltig...
GraphTalks Stuttgart - semantic data management – der Weg zu einer nachhaltig...
 
1. intranda Goobi Tag: Vom Tool zum Trend
1. intranda Goobi Tag: Vom Tool zum Trend1. intranda Goobi Tag: Vom Tool zum Trend
1. intranda Goobi Tag: Vom Tool zum Trend
 
Fit für Web 3.0 - Semantische Technologien
Fit für Web 3.0 - Semantische TechnologienFit für Web 3.0 - Semantische Technologien
Fit für Web 3.0 - Semantische Technologien
 
BizDataX - Data Masking Solution - Datamasking-Tool
BizDataX - Data Masking Solution - Datamasking-ToolBizDataX - Data Masking Solution - Datamasking-Tool
BizDataX - Data Masking Solution - Datamasking-Tool
 
Cognitive Computing in der Finanzindustrie
Cognitive Computing in der FinanzindustrieCognitive Computing in der Finanzindustrie
Cognitive Computing in der Finanzindustrie
 
Data model mal anders
Data model mal andersData model mal anders
Data model mal anders
 
Software Architecture Design Patterns der COMLINE Cloud Service Platform - CSP
Software Architecture Design Patterns der COMLINE Cloud Service Platform - CSPSoftware Architecture Design Patterns der COMLINE Cloud Service Platform - CSP
Software Architecture Design Patterns der COMLINE Cloud Service Platform - CSP
 
Tech-Talk: iRods
Tech-Talk: iRodsTech-Talk: iRods
Tech-Talk: iRods
 
TFF2023 - Navigating Tourism Data Nexus
TFF2023 - Navigating Tourism Data NexusTFF2023 - Navigating Tourism Data Nexus
TFF2023 - Navigating Tourism Data Nexus
 
SoSem 2015 | IT-Zertifikat: Tools & Methods in Digital Humanities - 01_Digita...
SoSem 2015 | IT-Zertifikat: Tools & Methods in Digital Humanities - 01_Digita...SoSem 2015 | IT-Zertifikat: Tools & Methods in Digital Humanities - 01_Digita...
SoSem 2015 | IT-Zertifikat: Tools & Methods in Digital Humanities - 01_Digita...
 
Einführung in Metadatenverwaltung
Einführung in MetadatenverwaltungEinführung in Metadatenverwaltung
Einführung in Metadatenverwaltung
 

PREMIS in METS: Die beiden Datenmodelle Matterhorn METS und Archivematica

  • 1. PREMIS in METS: Die beiden Datenmodelle Matterhorn METS und Archivematica Nestor-Praktikertag 2018: Metadaten für die digitale Langzeitarchivierung und der Metadatenstandard PREMIS Frankfurt am Main, 6. Juni 2018 Dr. Tobias Wildi, t.wildi@docuteam.ch 1
  • 3. Was ist METS? Und was ist ein METS- Profil? • METS = Metadata Encoding and Transmission Standard Verwaltet durch die Library of Congress http://www.loc.gov/standards/mets/ • METS ist ein Containerformat, welcher geeignet ist, – um das Informationsmodell von OAIS abzubilden – um Informationspakete zu serialisieren (systemunabhängig als eigenständige Paket weiterzugeben) • Die konkrete Umsetzung von METS lässt grosse Flexibilität zu. In einem «Profil» wird im Detail beschrieben, – wie METS verwendet wird, – welche weiteren Standards eingebunden werden – wie diese Standards aufeinander abgestimmt werden. • http://www.loc.gov/standards/mets/mets-profiles.html 3
  • 4. METS – Metadata Transmission and Encoding Standard 4
  • 5. Matterhorn METS-Profil • Ist ein METS-Profil • Basiert auf METS, EAD und PREMIS 2.2 • Ko-Entwicklung Staatsarchiv Wallis (CH) und docuteam. • 2012 bei der Library of Congress registriert http://www.loc.gov/standards/mets/profiles/00000041.xml • Wird unterstützt durch die Open Source-Werkzeuge die docuteam für die digitale Archivierung entwickelt (docuteam packer, docuteam feeder) • Wird zunehmend auch als Ablieferungsformat genutzt und nicht durch docuteam-Werkzeuge gebildet. • Wird gegenwärtig weiterentwickelt zu «Matterhorn RDF», respektive «IP new generation», was in der Schweiz eCH-0160 ablösen soll. 5
  • 6. Matterhorn METS-Profil bildet das OAIS-Informationsmodell ab 6 Representation Information Data Object (Dateien) Preservation Description Information Descriptive Information PREMIS PREMSI ISAD(G) à EAD METS (Metadata Encoding and Transmission Standard) Container
  • 7. Archivematica 7 • Artefactual Systems, Inc., Toronto. • Artefactual ist mit Evelyn McLellan selber im PREMIS-Board vertreten • Archivematica bezeichnet sich als «Core Preservation System»: Bewertung, Ingest, Speicherung, Preservation Planning / Preservation Actions. • Open Source (GPL3). • Datenmodell basiert auf METS und Premis 2.2. Dokumentation: https://wiki.archivematica.org/METS
  • 9. Library of Congress: Using PREMIS with METS • Library of Congress: «Guidelines for using PREMIS with METS for exchange Revised September 17, 2008» https://www.loc.gov/standards/premis/guidelines-premismets.pdf • Library of Congress «Guidelines for using PREMIS with METS for exchange Revised January 2017» https://www.loc.gov/standards/premis/guidelines2017-premismets.pdf Folgende Punkte werden geregelt: 1. Using PREMIS in METS sections 2. Use of PREMIS container «Use of one amdSec with repeating subelements (techMD, etc.) or repeating amdSec for each METS subelement is an implementer’s preference. These are semantically equivalent» 3. Redundancies between PREMIS and METS 4. METS structMap and PREMIS structural relationship elements 5. METS ID/IDREF and PREMIS identifier elements 6. Use of METS profiles 9
  • 10. Matterhorn METS – Einbetten von PREMISmets metsHdr dmdSec mdWrap EAD amdSec digiprovMD mdWrap PREMIS PREMIS:OBJECT PREMIS:EVENT PREMIS:AGENTfileSec structmap 10 Eine einzige amdSec für das gesamte Informationspaket Ein digiprovMD- Block pro Objekt
  • 11. Archivematica – Einbetten von PREMIS mets metsHdr dmdSec amdSec techMD mdWrap PREMIS:OBJECT digiprovMD mdWrap PREMIS:EVENT PREMIS:AGENT fileSec structmap 11 Eine amdSec pro Objekt
  • 12. Matterhorn METS: Eine amdSec für alle Objekte 12
  • 13. Matterhorn METS Ein digiprovMD-Block pro Objekt • PREMIS-Informationen zu einem Ordner oder einer Datei werden je in einer digiprovMD-Sektion zusammengefasst 13
  • 15. Archivematica: techMD und digiprovMD • techMD für PREMIS:OBJECT • digiprovMD für PREMIS:EVENT, PREMIS:AGENT 15
  • 17. Redundanzen zwischen METS und PREMIS LoC Implementation Guidelines: «An implementer may decide whether it is easier to include the information redundantly, based on how the data will be used and/or supplied. Implementers should consider the use of the metadata (e.g. display or preservation) and whether the METS (for display) or PREMIS (for preservation) is primary when deciding which to use and whether to record redundantly.» 17
  • 18. Redundanzen: Beispiele • Beispiel Fixity Information (Checksumme): – <METS:file CHECKSUM=“[WERT]“ CHECKSUMTYPE=“[Wert]“> – <PREMIS:fixity> <messageDigestAlgorithm> <messageDigest> • Beispiel Dateiformat: – <METS:file MIMETYPE=“[Wert]“> – <PREMIS:formatDesignation> <formatName> <formatVersion> • Entscheid bei Matterhorn METS: – Fixity in PREMIS – MIME-Type in METS (display), weiterführende Beschreibung von Dateiformat und Version in PREMIS (preservation). 18
  • 20. Archivematica: Event • Pro Event wird geschrieben: – eventIdentifier – eventType – eventDateTime – eventDetail • eventOutcomeInformation • eventOutcome eventOucomeDetail – linkingAgentIdentifier • linkingAgentIdentifierType (eg. preservation system, repository code, Archivematica user) • linkingAgentIdentifierValue – kein linkingObjectIdentifier, der Event bezieht sich jeweils auf das Object in der gleichen amdSec 20
  • 21. Matterhorn METS: Event • Pro Event wird geschrieben: – eventIdentifier – eventType (standardisiertes Vokabular, abgestimmt auf LoC-Vokabular) – eventDateTime (Timestamp) – eventDetail (hier auch textliche Beschreibung des Akteurs) – eventOutcomeInformation • eventOutcome (success/failure) • eventOucomeDetail – linkingObjectIdentifier • linkingObjetctIdentifierType • linkingObjectIdentifierValue 21
  • 22. Matterhorn METS: Event-Typen • Die Event-Typen sind nicht Teil des METS-Profils. Verwendet werden folgende Typen: – Creation – Rename – Fixity Check – Deletion – Path Modification – Migration – Replace • Ausser “Replace” handelt es sich um Event Types aus dem Standardvokabular der Library of Congress: http://id.loc.gov/vocabulary/preservation/eventType.html 22
  • 25. Archivematica und Matterhorn METS Archivematica Matterhorn METS PREMIS 2.2 PREMIS in METS eingebettet und nicht nur verlinkt dezentralisiert: - Eine amdSec pro Objekt - Ein techMD-Block pro Objekt - Ein digiprovMD-Block pro Event, Agent zentralisiert: - Eine einzige amdSec pro Paket - Ein digiprovMD-Block pro Objekt kein registriertes METS-Profil METS-Profil: http://www.loc.gov/standards/mets/profi les/00000041.xml Loglevel in Archivematica: Detailliert, möglichst umfassende technische Metadaten Loglevel in docuteam feeder: Soviel wie nötig als Grundlage für Preservation Planning 25
  • 26. Fazit • In den beiden Modellen werden praktisch identische Informationen kodiert. • Matterhorn METS zentral, Archivematica dezentralisiert. • LoC: «Use of one amdSec with repeating subelements (techMD, etc.) or repeating amdSec for each METS subelement is an implementer’s preference. These are semantically equivalent» • Dass unabhängig voneinander zwei Datenmodelle mit dieser hohen Ähnlichkeit entwickelt wurde zeigt, dass – die Standardisierungsdokumente hinreichend detailliert verfasst sind – die Implementation Guidelines der LoC praxisorientiert, umsetzbar und klar formuliert sind • Am Vergleich von Archivematica und Matterhorn METS zeigt sich, dass ein Produktwechsel zwar syntaktische Änderungen an den API nach sich ziehen würde, die Semantik sich aber gleich bleibt. 26