4. Beispiel Volltexterfassung und Strukturierung
• Retrokonversion von Findmitteln
• Arbeitsformat Editura-intern, Zielformat EAD
• METS für Images der Vorlagen
• Verknüpfung von Findbuch und Images für einfache
Kontrolle und Korrektur
• MidosaXML und METSview
Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
5. Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
6. Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
7. <verzeinh>
! <vzerschlang>
! ! <bemerk>ID: DC15-1</bemerk>
Pfad im Dateisystem
! ! <bemerk>Image: DC15DC15_01IMG_0010a.jpg</bemerk>
! ! <laufzeit>März 1948 - Sept. 1949 (1948- 1949)</laufzeit>
! ! <signatur>DC 15/713</signatur>
! ! <titel>Organisation und Arbeitsweise der DWK</titel>
! ! <dao>
! ! ! <dateiname>../METS/METSview.html?ID=FID_DC15-DC15_01-
IMG_0010a.jpg</dateiname>
! ! ! <beschreibung>Image der Vorlage</beschreibung>
! ! </dao> Link zur Anwendung
mit File-ID
! ! <provenienz>
! ! ! <vorprovenienz>Sekretariat des Vors. der DWK H. Rau</vorprovenienz>
! ! ! <endprovenienz>Deutsche Wirtschaftskommission</endprovenienz>
! ! </provenienz>
! </vzerschlang>
</verzeinh>
Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
8. <fileSec>
<fileGrp ID="FID_DC15">
[…]
die File-ID ist das
<file ID="FID_DC15-DC15_01-IMG_0010a.jpg"> Sprungziel für die
! <FLocat LOCTYPE="URL" xlink:href="DC15/DC15_01/IMG_0010a.jpg" aus EAD
Verlinkung
! ! xlink:title="Image von DC15/DC15_01/IMG_0010a.jpg"/>
</file>
[…]
<structMap>
<div LABEL="DC15" ID="ID_DC15">
aus den LABEL-
<div ID="ID_DC15-DC15_01" LABEL="DC15_01"> Attributen wird die
[…] Baumansicht erzeugt
<div TYPE="standard" ID="ID_SGF_DC15-DC15_01-IMG_0010a.jpg"
LABEL="IMG_0010a.jpg">
<fptr FILEID="FID_DC15-DC15_01-IMG_0010a.jpg"/>
</div>
[…]
Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
9. Beispiel Imagedigitalisierung und
Datenverarbeitung
• Scannenvon verfilmten Akten und
Verknüpfung mit EAD-Findbuch
• Arbeits-
und Zielformate: EAD und METS
für MEX/MIDEX
• Erzeugen von METS-Dateien und HTML-Ansichten
Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
10. Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
11. Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
12. <c03 level="file">
<head>Betriebskostenentwicklung</head>
<did>
<unitid type="bestellnummer"> 19</unitid>
<unittitle>Betriebskostenentwicklung</unittitle>
<unitdate normal="1925-01-01/1932-12-31">1925 - 1932</unitdate>
<abstract encodinganalog="EnthaeltDarin" type="enthaelt">Enthält u. a.: Bericht
zur Lohnbewegung […]</abstract>
<dao xlink:href="31072_019_mets.xml" xlink:title="Akte einsehen"/>
</did>
Link auf METS-Datei, MEX/
</c03> MIDEX erzeugen den
korrekten Link und die
Benutzungsoberflächen
Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
14. Beispiel Imagedigitalisierung
• Scannen von Zeitschriften
• Ausgabe als TIFF, JPEG und PDF (mit hinterlegter
OCR)
• METS-Dateien zum Transport der Strukturdaten
und zur Überprüfung auf Vollständigkeit und
Integrität
Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
15. Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
16. <mets:file ID="id3E491636EFE0923FE4EBC931B0E2F118" MIMETYPE="image/jpeg"
SEQ="0" SIZE="5554162" CREATED="2011-01-31T22:03:28Z"
CHECKSUM="AE563748136ACC3006493C744DA50031" CHECKSUMTYPE="MD5">
! <mets:FLocat LOCTYPE="URL" xlink:href="SinglePageImagesBig0004.jpg"/>
! <mets:FContent> mit diesen Angaben kann geprüft werden, ob die Dateien
! ! <mets:xmlData> im Dateisystem bzw. auf der Festplatte unverändert sind
! ! ! <mix:mix>
! ! ! ! […]
! ! ! ! <mix:BasicImageInformation>
! ! ! ! ! <mix:BasicImageCharacteristics>
! ! ! ! ! ! <mix:imageWidth>4075</mix:imageWidth>
! ! ! ! ! ! <mix:imageHeight>5572</mix:imageHeight>
! ! ! ! ! ! <mix:PhotometricInterpretation>
! ! ! ! ! ! ! <mix:colorSpace>RGB</mix:colorSpace>
! ! ! ! ! ! </mix:PhotometricInterpretation>
eingebundene MIX-Daten:
! ! ! ! ! </mix:BasicImageCharacteristics> technische Metadaten zum
Dateiinhalt, hier Pixelmaße und
! ! ! ! </mix:BasicImageInformation> Farbtiefe
! ! ! ! […]
Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
17. Beispiel Image- und Volltextdigitalisierung
• Scannen von Zeitschriften (durch SLUB)
• Ausgabe der Images als TIFF und JPEG
• Ausgabe der Volltexte als TEI
• METS-Dateien
aus TEI generiert, zur Darstellung
im DFG-Viewer
Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
18. Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
19. <mets:dmdSec ID="dMD32258227Z_pj001">
<mets:mdWrap MIMETYPE="text/xml" MDTYPE="MODS">
<mets:xmlData>
<mods:mods>
<mods:titleInfo>
<mods:title>Polytechnisches Journal</mods:title>
<mods:subTitle>Herausgegeben von Dr. Johann Gottfried Dingler,
Chemiker und Fabrikanten etc. </mods:subTitle>
<mods:subTitle>Mit 10 Kupfertafeln. </mods:subTitle>
</mods:titleInfo>
<mods:name type="personal">
<mods:displayForm authority="gnd">Dr. Johann Gottfried Dingler
! ! ! </mods:displayForm>
<mods:namePart type="family">Dingler</mods:namePart>
<mods:namePart type="given">Johann Gottfried</mods:namePart>
<mods:namePart type="date">1778-1855</mods:namePart>
[…] eingebundene MODS-Daten mit
bibliographischen Angaben
Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
21. METS bei Editura
Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
22. (unsere) Anwendungsfälle für METS
• Präsentation offline
• Präsentation online
• Metadatentransport
• Datenüberprüfung/Langzeitarchivierung
• (Abrechnung)
Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
23. verwaltete Dateien
• Images
(Master und Derivate) als TIFF, JPEG, PNG,
PDF usw.
• Textdateien, teilweise strukturiert, als TXT, EAD, TEI
usw.
• HTML-Präsentationen
• u.v.a.
Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
24. Arten von Metadaten
• technische Metadaten
• Dateipfade
• Größe, Änderungsdatum, Checksumme
• Informationen zum Inhalt: Mediatype, Pixelmaße,
Auflösung, Farbprofil u.v.m.
• inhaltlicheMetadaten
• Strukturdaten
• alle anderen beschreibenden Daten wie Angaben
zu Bestand, Signatur, Autor
Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
25. Plädoyer für Strukturdaten
• Technische Metadaten lassen sich sehr einfach
erstellen, während inhaltliche Metadaten, besonders
Strukturdaten, einen nennenswerten intellektuellen
Aufwand erfordern.
• Aber: Strukturdaten erschließen die Digitalisate und
bestimmen i.d.R. die Darstellung und Navigation für
Benutzer und tragen damit wesentlich zum Erfolg
eines Imagedigitalisierungsprojektes bei.
Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
27. Profile
• Profilelegen fest, wie die verfügbaren Elemente
eingesetzt werden, um Daten abzubilden. Sie treffen
eine Auswahl unter Alternativen.
• Beispiele:
• DFG-Viewer
• MEX/MIDEX
• weitereunter http://www.loc.gov/standards/mets/
mets-profiles.html
Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
28. Einsatz von METS-Profilen bei Editura
• alle Profile, die unsere Kunden benötigen
• ImZweifel bevorzugen wir die richtige Darstellung
auf dem Zielsystem ggü. der »richtigen« Semantik.
• eigenesProfil für Archivierung, eigene Software zur
METS-Erzeugung und Überprüfung archivierter
Dateien
Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
29. unsere Wünsche an ein Profil
• ein
Profil; wenige Pflichtelemente, unterschiedliche
Anwendungsfälle durch optionale Elemente
abdecken
• eherweniger Funktionen resp. Elemente und
Attribute, diese aber überall vollständig unterstützt
• dauerhafte Pflege des Profils (Präzisierungen,
Aktualisierungen, Dokumentation)
• Schema zur Validierung der Daten
Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
30. unsere Wünsche an eine Software
• vollständige Unterstützung des jeweiligen Profils
• Erzeugung von offline-fähigen Präsentationen, d.h.
ohne Internetzugang und Serverunterstützung
ausführbar
• Präsentation
unterstützt Deep-Links, d.h. Sprung zu
einem konkreten Image, mit Aufbau des Kontextes
• Datei-Überprüfung und Statistik
Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de