SlideShare ist ein Scribd-Unternehmen logo
1 von 31
DIGITALISIERUNG ALS DIENSTLEISTUNG
      Images, Metadaten, Strukturdaten




                                            Stefan Krause
                           Editura GmbH & Co. KG, Berlin
                                    http://www.editura.de
Editura GmbH & Co. KG
• Dienstleister   für Digitalisierungsprojekte
• Kunden: Archive, Bibliotheken, Verlage,
 wissenschaftliche Einrichtungen
• Imagedigitalisierung: Bücher, Zeitschriften, Akten,
 Fotosammlungen usw.
• Volltexterfassungund Strukturierung: Findmittel,
 Bibliothekskataloge, alle Arten von Literatur
• Datenverarbeitung: Prüfen, Korrigieren,
 Konvertieren, Verknüpfen
                  Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
Projektbeispiele




Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
Beispiel Volltexterfassung und Strukturierung

• Retrokonversion     von Findmitteln

• Arbeitsformat   Editura-intern, Zielformat EAD

• METS   für Images der Vorlagen

• Verknüpfung von Findbuch und Images für einfache
 Kontrolle und Korrektur

• MidosaXML     und METSview
                Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
<verzeinh>
!     <vzerschlang>
!     !   <bemerk>ID: DC15-1</bemerk>
                                                                   Pfad im Dateisystem
!     !   <bemerk>Image: DC15DC15_01IMG_0010a.jpg</bemerk>
!     !   <laufzeit>März 1948 - Sept. 1949 (1948- 1949)</laufzeit>
!     !   <signatur>DC 15/713</signatur>
!     !   <titel>Organisation und Arbeitsweise der DWK</titel>
!     !   <dao>
!     !   !    <dateiname>../METS/METSview.html?ID=FID_DC15-DC15_01-
IMG_0010a.jpg</dateiname>
!     !   !    <beschreibung>Image der Vorlage</beschreibung>
!     !   </dao>                                                   Link zur Anwendung
                                                                   mit File-ID
!     !   <provenienz>
!     !   !    <vorprovenienz>Sekretariat des Vors. der DWK H. Rau</vorprovenienz>
!     !   !    <endprovenienz>Deutsche Wirtschaftskommission</endprovenienz>
!     !   </provenienz>
!     </vzerschlang>
</verzeinh>


                      Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
<fileSec>
    <fileGrp ID="FID_DC15">
       […]
                                                                  die File-ID ist das
       <file ID="FID_DC15-DC15_01-IMG_0010a.jpg">                  Sprungziel für die
!     <FLocat LOCTYPE="URL" xlink:href="DC15/DC15_01/IMG_0010a.jpg" aus EAD
                                                                  Verlinkung

!     !           xlink:title="Image von DC15/DC15_01/IMG_0010a.jpg"/>
       </file>
[…]


<structMap>
 <div LABEL="DC15" ID="ID_DC15">
                                                             aus den LABEL-
   <div ID="ID_DC15-DC15_01" LABEL="DC15_01">                Attributen wird die
     […]                                                     Baumansicht erzeugt

     <div TYPE="standard" ID="ID_SGF_DC15-DC15_01-IMG_0010a.jpg"
          LABEL="IMG_0010a.jpg">
       <fptr FILEID="FID_DC15-DC15_01-IMG_0010a.jpg"/>
     </div>
[…]


                       Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
Beispiel Imagedigitalisierung und
 Datenverarbeitung

• Scannenvon verfilmten Akten und
 Verknüpfung mit EAD-Findbuch

• Arbeits-
        und Zielformate: EAD und METS
 für MEX/MIDEX

• Erzeugen   von METS-Dateien und HTML-Ansichten

                Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
<c03 level="file">
  <head>Betriebskostenentwicklung</head>
  <did>
     <unitid type="bestellnummer"> 19</unitid>
     <unittitle>Betriebskostenentwicklung</unittitle>
     <unitdate normal="1925-01-01/1932-12-31">1925 - 1932</unitdate>
     <abstract encodinganalog="EnthaeltDarin" type="enthaelt">Enthält u. a.: Bericht
zur Lohnbewegung […]</abstract>
     <dao xlink:href="31072_019_mets.xml" xlink:title="Akte einsehen"/>
  </did>
                                                                  Link auf METS-Datei, MEX/
</c03>                                                            MIDEX erzeugen den
                                                                       korrekten Link und die
                                                                       Benutzungsoberflächen




                        Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
<fileSec>
!     <fileGrp ID="FID_31072" USE="nutz">
!     !   <file ID="FID_31072_31072_019-31072_019_001" MIMETYPE="image/png"
!     !   !    USE="nutz">
!     !   !    <FLocat LOCTYPE="URL"
!     !   !    !  xlink:href="dao/31072_019/31072_019_001.png"/>
!     !   </file>
        […]
                                                                      über TYPE-Attribute
                                                                      wird die Darstellung in
                                                                      der Benutzeroberfläche
<structMap>                                                           gesteuert
!     <div>
!     !   <div ID="ID_SGF_31072_019-31072_019_001" TYPE="standard">
!     !   !    <fptr FILEID="FID_31072_31072_019-31072_019_001"/>
!     !   </div>
!     !   <div ID="ID_SGF_31072_019-31072_019_002" TYPE="bika"
!     !   !    LABEL="Titelblatt">
!     !   !    <fptr FILEID="FID_31072_31072_019-31072_019_002"/>
!     !   </div>


                   Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
Beispiel Imagedigitalisierung

• Scannen   von Zeitschriften

• Ausgabe   als TIFF, JPEG und PDF (mit hinterlegter
 OCR)

• METS-Dateien zum Transport der Strukturdaten
 und zur Überprüfung auf Vollständigkeit und
 Integrität

                Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
<mets:file ID="id3E491636EFE0923FE4EBC931B0E2F118" MIMETYPE="image/jpeg"
SEQ="0" SIZE="5554162" CREATED="2011-01-31T22:03:28Z"
CHECKSUM="AE563748136ACC3006493C744DA50031" CHECKSUMTYPE="MD5">
!    <mets:FLocat LOCTYPE="URL" xlink:href="SinglePageImagesBig0004.jpg"/>
!    <mets:FContent>                       mit diesen Angaben kann geprüft werden, ob die Dateien
!    !     <mets:xmlData>                  im Dateisystem bzw. auf der Festplatte unverändert sind
!    !     !   <mix:mix>
!    !     !   !   […]
!    !     !   !   <mix:BasicImageInformation>
!    !     !   !   !   <mix:BasicImageCharacteristics>
!    !     !   !   !   !   <mix:imageWidth>4075</mix:imageWidth>
!    !     !   !   !   !   <mix:imageHeight>5572</mix:imageHeight>
!    !     !   !   !   !   <mix:PhotometricInterpretation>
!    !     !   !   !   !   !   <mix:colorSpace>RGB</mix:colorSpace>
!    !     !   !   !   !   </mix:PhotometricInterpretation>
                                                                     eingebundene MIX-Daten:
!    !     !   !   !   </mix:BasicImageCharacteristics>              technische Metadaten zum
                                                                     Dateiinhalt, hier Pixelmaße und
!    !     !   !   </mix:BasicImageInformation>                       Farbtiefe
!    !     !   !   […]


                          Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
Beispiel Image- und Volltextdigitalisierung

• Scannen   von Zeitschriften (durch SLUB)

• Ausgabe   der Images als TIFF und JPEG

• Ausgabe   der Volltexte als TEI

• METS-Dateien
             aus TEI generiert, zur Darstellung
 im DFG-Viewer

                Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
<mets:dmdSec ID="dMD32258227Z_pj001">
   <mets:mdWrap MIMETYPE="text/xml" MDTYPE="MODS">
    <mets:xmlData>
       <mods:mods>
        <mods:titleInfo>
          <mods:title>Polytechnisches Journal</mods:title>
          <mods:subTitle>Herausgegeben von Dr. Johann Gottfried Dingler,
Chemiker und Fabrikanten etc. </mods:subTitle>
          <mods:subTitle>Mit 10 Kupfertafeln. </mods:subTitle>
        </mods:titleInfo>
        <mods:name type="personal">
          <mods:displayForm authority="gnd">Dr. Johann Gottfried Dingler
!    !   !    </mods:displayForm>
          <mods:namePart type="family">Dingler</mods:namePart>
          <mods:namePart type="given">Johann Gottfried</mods:namePart>
          <mods:namePart type="date">1778-1855</mods:namePart>
          […]                                                eingebundene MODS-Daten mit
                                                                   bibliographischen Angaben




                       Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
<mets:structMap TYPE="LOGICAL">
!    <mets:div ID="LOGdiv32258227Zd4" TYPE="volume" Strukturdaten: Schachtelung von
                                                          div-Elementen, Beschriftung in
!    !    !   DMDID="dMD32258227Z_pj001" ADMID="aMD32258227Z"
                                                          den LABEL-Attributen

!    !    !   LABEL="Polytechnisches Journal. Band 1">
!    !    <mets:div ID="LOGdiv32258227Zd4e686" TYPE="titlePage"
!    !    !   LABEL="Titelblatt" DMDID="dMD32258227Z_pj001"/>
!    !    <mets:div ID="LOGdiv32258227Zd4e721" TYPE="preface"
!    !    !   LABEL="Vorwort" DMDID="dMD32258227Z_pj001"/>
!    !    <mets:div ID="LOGdiv32258227Zd4e761" TYPE="contents"
!    !    !   LABEL="Inhaltsverzeichnis" DMDID="dMD32258227Z_pj001"/>
!    !    <mets:div ID="LOGdiv32258227Zd4e1355" TYPE="issue"
!    !    !   LABEL="Heft 1" DMDID="dMD32258227Z_is001001">
!    !    !   <mets:div ID="LOGdiv32258227Zd4e1358" TYPE="article"
!    !    !   !   LABEL="I. Marechaux über die hydraulische Presse."
!    !    !   !   DMDID="dMD32258227Z_ar001001"/>
!    !    !   <mets:div ID="LOGdiv32258227Zd4e3254" TYPE="article"
!    !    !   !   LABEL="III. Kurrer über den neuen Seidendruck mittelst
!    !    !   !   !   !   örtlicher Farben." DMDID="dMD32258227Z_ar001003"/>



                       Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
METS bei Editura




 Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
(unsere) Anwendungsfälle für METS

• Präsentation   offline

• Präsentation   online

• Metadatentransport

• Datenüberprüfung/Langzeitarchivierung

• (Abrechnung)


                 Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
verwaltete Dateien

• Images
       (Master und Derivate) als TIFF, JPEG, PNG,
 PDF usw.

• Textdateien, teilweise      strukturiert, als TXT, EAD, TEI
 usw.

• HTML-Präsentationen

• u.v.a.

               Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
Arten von Metadaten
• technische Metadaten
 • Dateipfade
 • Größe, Änderungsdatum, Checksumme
 • Informationen zum Inhalt: Mediatype, Pixelmaße,
   Auflösung, Farbprofil u.v.m.
• inhaltlicheMetadaten
 • Strukturdaten
 • alle anderen beschreibenden Daten wie Angaben
   zu Bestand, Signatur, Autor
                Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
Plädoyer für Strukturdaten
• Technische Metadaten lassen sich sehr einfach
 erstellen, während inhaltliche Metadaten, besonders
 Strukturdaten, einen nennenswerten intellektuellen
 Aufwand erfordern.
• Aber: Strukturdaten  erschließen die Digitalisate und
 bestimmen i.d.R. die Darstellung und Navigation für
 Benutzer und tragen damit wesentlich zum Erfolg
 eines Imagedigitalisierungsprojektes bei.

               Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
•   Photograph © Andrew Dunn – Website: http://www.andrewdunnphoto.com/ – CC-by-SA 2.0
Profile
• Profilelegen fest, wie die verfügbaren Elemente
 eingesetzt werden, um Daten abzubilden. Sie treffen
 eine Auswahl unter Alternativen.
• Beispiele:
 • DFG-Viewer
 • MEX/MIDEX
 • weitereunter http://www.loc.gov/standards/mets/
   mets-profiles.html
               Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
Einsatz von METS-Profilen bei Editura

• alle   Profile, die unsere Kunden benötigen

• ImZweifel bevorzugen wir die richtige Darstellung
 auf dem Zielsystem ggü. der »richtigen« Semantik.

• eigenesProfil für Archivierung, eigene Software zur
 METS-Erzeugung und Überprüfung archivierter
 Dateien

                  Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
unsere Wünsche an ein Profil
• ein
    Profil; wenige Pflichtelemente, unterschiedliche
 Anwendungsfälle durch optionale Elemente
 abdecken
• eherweniger Funktionen resp. Elemente und
 Attribute, diese aber überall vollständig unterstützt
• dauerhafte Pflege des Profils (Präzisierungen,
 Aktualisierungen, Dokumentation)
• Schema   zur Validierung der Daten
                Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
unsere Wünsche an eine Software
• vollständige   Unterstützung des jeweiligen Profils
• Erzeugung von offline-fähigen Präsentationen, d.h.
 ohne Internetzugang und Serverunterstützung
 ausführbar
• Präsentation
            unterstützt Deep-Links, d.h. Sprung zu
 einem konkreten Image, mit Aufbau des Kontextes
• Datei-Überprüfung          und Statistik

                  Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
DIGITALISIERUNG ALS DIENSTLEISTUNG
             Images, Metadaten, Strukturdaten

Herzlichen Dank für Ihre Aufmerksamkeit!




    •   Photograph © Andrew Dunn – Website: http://www.andrewdunnphoto.com/ – CC-by-SA 2.0



                                                                                Stefan Krause
                                                               Editura GmbH & Co. KG, Berlin
                                                                        http://www.editura.de

Weitere ähnliche Inhalte

Ähnlich wie Digitalisierung als Dienstleistung

Blank Template - less is more #jd13ch
Blank Template - less is more #jd13chBlank Template - less is more #jd13ch
Blank Template - less is more #jd13chAlexander Schmidt
 
Back to Basics German 2: Erstellen Sie Ihre erste Anwendung in MongoDB
Back to Basics German 2: Erstellen Sie Ihre erste Anwendung in MongoDBBack to Basics German 2: Erstellen Sie Ihre erste Anwendung in MongoDB
Back to Basics German 2: Erstellen Sie Ihre erste Anwendung in MongoDBMongoDB
 
Dojo Und Notes
Dojo Und NotesDojo Und Notes
Dojo Und Notesdominion
 
Visuelle Gestaltung und Testdatenentwicklung mit BizDataX
Visuelle Gestaltung und Testdatenentwicklung mit BizDataXVisuelle Gestaltung und Testdatenentwicklung mit BizDataX
Visuelle Gestaltung und Testdatenentwicklung mit BizDataXDragan Kinkela
 
Adaptive Cards - User Interfaces with JSON
Adaptive Cards - User Interfaces with JSONAdaptive Cards - User Interfaces with JSON
Adaptive Cards - User Interfaces with JSONChristian Nagel
 
Was nicht passt wird responsive gemacht - Extended Edition
Was nicht passt wird responsive gemacht - Extended EditionWas nicht passt wird responsive gemacht - Extended Edition
Was nicht passt wird responsive gemacht - Extended EditionChristoph Reinartz
 
FCE ohne TemplaVoila
FCE ohne TemplaVoilaFCE ohne TemplaVoila
FCE ohne TemplaVoilaTobias Liegl
 
Dokumentation schreiben kann spass machen
Dokumentation schreiben kann spass machenDokumentation schreiben kann spass machen
Dokumentation schreiben kann spass machenSebastian Hempel
 
Dita Spezialisierung - Wie machen Sie es, und warum Sie es machen sollen.
Dita Spezialisierung - Wie machen Sie es, und warum Sie es machen sollen.Dita Spezialisierung - Wie machen Sie es, und warum Sie es machen sollen.
Dita Spezialisierung - Wie machen Sie es, und warum Sie es machen sollen.Jang F.M. Graat
 
Türme bauen mit Schildbürgern
Türme bauen mit SchildbürgernTürme bauen mit Schildbürgern
Türme bauen mit SchildbürgernNicolai Schwarz
 
HTML5 Übersicht
HTML5 ÜbersichtHTML5 Übersicht
HTML5 Übersichtwdbmh
 
FMK2022 Drucken über Dateigrenzen hinweg von Philipp Puls
FMK2022 Drucken über Dateigrenzen hinweg von Philipp PulsFMK2022 Drucken über Dateigrenzen hinweg von Philipp Puls
FMK2022 Drucken über Dateigrenzen hinweg von Philipp PulsVerein FM Konferenz
 
Layout Frameworks im professionellen Webdesign
Layout Frameworks im professionellen WebdesignLayout Frameworks im professionellen Webdesign
Layout Frameworks im professionellen Webdesigndjesse
 
JAMstack / Static Site Generators
JAMstack / Static Site GeneratorsJAMstack / Static Site Generators
JAMstack / Static Site GeneratorsDietrichRordorf
 
Website projektpräsentation
Website projektpräsentationWebsite projektpräsentation
Website projektpräsentationdein feedback
 
20150319 prs smm landing page_v1
20150319 prs smm landing page_v120150319 prs smm landing page_v1
20150319 prs smm landing page_v1INM AG
 
Open Source Monitoring mit Icinga 2 (Webinar vom 13.11.2013)
Open Source Monitoring mit Icinga 2 (Webinar vom 13.11.2013)Open Source Monitoring mit Icinga 2 (Webinar vom 13.11.2013)
Open Source Monitoring mit Icinga 2 (Webinar vom 13.11.2013)NETWAYS
 

Ähnlich wie Digitalisierung als Dienstleistung (20)

Blank Template - less is more #jd13ch
Blank Template - less is more #jd13chBlank Template - less is more #jd13ch
Blank Template - less is more #jd13ch
 
Back to Basics German 2: Erstellen Sie Ihre erste Anwendung in MongoDB
Back to Basics German 2: Erstellen Sie Ihre erste Anwendung in MongoDBBack to Basics German 2: Erstellen Sie Ihre erste Anwendung in MongoDB
Back to Basics German 2: Erstellen Sie Ihre erste Anwendung in MongoDB
 
Dojo Und Notes
Dojo Und NotesDojo Und Notes
Dojo Und Notes
 
Visuelle Gestaltung und Testdatenentwicklung mit BizDataX
Visuelle Gestaltung und Testdatenentwicklung mit BizDataXVisuelle Gestaltung und Testdatenentwicklung mit BizDataX
Visuelle Gestaltung und Testdatenentwicklung mit BizDataX
 
Adaptive Cards - User Interfaces with JSON
Adaptive Cards - User Interfaces with JSONAdaptive Cards - User Interfaces with JSON
Adaptive Cards - User Interfaces with JSON
 
CSS3 Media Queries
CSS3 Media QueriesCSS3 Media Queries
CSS3 Media Queries
 
Was nicht passt wird responsive gemacht - Extended Edition
Was nicht passt wird responsive gemacht - Extended EditionWas nicht passt wird responsive gemacht - Extended Edition
Was nicht passt wird responsive gemacht - Extended Edition
 
FCE ohne TemplaVoila
FCE ohne TemplaVoilaFCE ohne TemplaVoila
FCE ohne TemplaVoila
 
Dokumentation schreiben kann spass machen
Dokumentation schreiben kann spass machenDokumentation schreiben kann spass machen
Dokumentation schreiben kann spass machen
 
Blank Template für Joomla!
Blank Template für Joomla!Blank Template für Joomla!
Blank Template für Joomla!
 
Dita Spezialisierung - Wie machen Sie es, und warum Sie es machen sollen.
Dita Spezialisierung - Wie machen Sie es, und warum Sie es machen sollen.Dita Spezialisierung - Wie machen Sie es, und warum Sie es machen sollen.
Dita Spezialisierung - Wie machen Sie es, und warum Sie es machen sollen.
 
Türme bauen mit Schildbürgern
Türme bauen mit SchildbürgernTürme bauen mit Schildbürgern
Türme bauen mit Schildbürgern
 
HTML5 Übersicht
HTML5 ÜbersichtHTML5 Übersicht
HTML5 Übersicht
 
FMK2022 Drucken über Dateigrenzen hinweg von Philipp Puls
FMK2022 Drucken über Dateigrenzen hinweg von Philipp PulsFMK2022 Drucken über Dateigrenzen hinweg von Philipp Puls
FMK2022 Drucken über Dateigrenzen hinweg von Philipp Puls
 
Layout Frameworks im professionellen Webdesign
Layout Frameworks im professionellen WebdesignLayout Frameworks im professionellen Webdesign
Layout Frameworks im professionellen Webdesign
 
Websemantics
WebsemanticsWebsemantics
Websemantics
 
JAMstack / Static Site Generators
JAMstack / Static Site GeneratorsJAMstack / Static Site Generators
JAMstack / Static Site Generators
 
Website projektpräsentation
Website projektpräsentationWebsite projektpräsentation
Website projektpräsentation
 
20150319 prs smm landing page_v1
20150319 prs smm landing page_v120150319 prs smm landing page_v1
20150319 prs smm landing page_v1
 
Open Source Monitoring mit Icinga 2 (Webinar vom 13.11.2013)
Open Source Monitoring mit Icinga 2 (Webinar vom 13.11.2013)Open Source Monitoring mit Icinga 2 (Webinar vom 13.11.2013)
Open Source Monitoring mit Icinga 2 (Webinar vom 13.11.2013)
 

Digitalisierung als Dienstleistung

  • 1. DIGITALISIERUNG ALS DIENSTLEISTUNG Images, Metadaten, Strukturdaten Stefan Krause Editura GmbH & Co. KG, Berlin http://www.editura.de
  • 2. Editura GmbH & Co. KG • Dienstleister für Digitalisierungsprojekte • Kunden: Archive, Bibliotheken, Verlage, wissenschaftliche Einrichtungen • Imagedigitalisierung: Bücher, Zeitschriften, Akten, Fotosammlungen usw. • Volltexterfassungund Strukturierung: Findmittel, Bibliothekskataloge, alle Arten von Literatur • Datenverarbeitung: Prüfen, Korrigieren, Konvertieren, Verknüpfen Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
  • 3. Projektbeispiele Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
  • 4. Beispiel Volltexterfassung und Strukturierung • Retrokonversion von Findmitteln • Arbeitsformat Editura-intern, Zielformat EAD • METS für Images der Vorlagen • Verknüpfung von Findbuch und Images für einfache Kontrolle und Korrektur • MidosaXML und METSview Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
  • 5. Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
  • 6. Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
  • 7. <verzeinh> ! <vzerschlang> ! ! <bemerk>ID: DC15-1</bemerk> Pfad im Dateisystem ! ! <bemerk>Image: DC15DC15_01IMG_0010a.jpg</bemerk> ! ! <laufzeit>März 1948 - Sept. 1949 (1948- 1949)</laufzeit> ! ! <signatur>DC 15/713</signatur> ! ! <titel>Organisation und Arbeitsweise der DWK</titel> ! ! <dao> ! ! ! <dateiname>../METS/METSview.html?ID=FID_DC15-DC15_01- IMG_0010a.jpg</dateiname> ! ! ! <beschreibung>Image der Vorlage</beschreibung> ! ! </dao> Link zur Anwendung mit File-ID ! ! <provenienz> ! ! ! <vorprovenienz>Sekretariat des Vors. der DWK H. Rau</vorprovenienz> ! ! ! <endprovenienz>Deutsche Wirtschaftskommission</endprovenienz> ! ! </provenienz> ! </vzerschlang> </verzeinh> Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
  • 8. <fileSec> <fileGrp ID="FID_DC15"> […] die File-ID ist das <file ID="FID_DC15-DC15_01-IMG_0010a.jpg"> Sprungziel für die ! <FLocat LOCTYPE="URL" xlink:href="DC15/DC15_01/IMG_0010a.jpg" aus EAD Verlinkung ! ! xlink:title="Image von DC15/DC15_01/IMG_0010a.jpg"/> </file> […] <structMap> <div LABEL="DC15" ID="ID_DC15"> aus den LABEL- <div ID="ID_DC15-DC15_01" LABEL="DC15_01"> Attributen wird die […] Baumansicht erzeugt <div TYPE="standard" ID="ID_SGF_DC15-DC15_01-IMG_0010a.jpg" LABEL="IMG_0010a.jpg"> <fptr FILEID="FID_DC15-DC15_01-IMG_0010a.jpg"/> </div> […] Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
  • 9. Beispiel Imagedigitalisierung und Datenverarbeitung • Scannenvon verfilmten Akten und Verknüpfung mit EAD-Findbuch • Arbeits- und Zielformate: EAD und METS für MEX/MIDEX • Erzeugen von METS-Dateien und HTML-Ansichten Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
  • 10. Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
  • 11. Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
  • 12. <c03 level="file"> <head>Betriebskostenentwicklung</head> <did> <unitid type="bestellnummer"> 19</unitid> <unittitle>Betriebskostenentwicklung</unittitle> <unitdate normal="1925-01-01/1932-12-31">1925 - 1932</unitdate> <abstract encodinganalog="EnthaeltDarin" type="enthaelt">Enthält u. a.: Bericht zur Lohnbewegung […]</abstract> <dao xlink:href="31072_019_mets.xml" xlink:title="Akte einsehen"/> </did> Link auf METS-Datei, MEX/ </c03> MIDEX erzeugen den korrekten Link und die Benutzungsoberflächen Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
  • 13. <fileSec> ! <fileGrp ID="FID_31072" USE="nutz"> ! ! <file ID="FID_31072_31072_019-31072_019_001" MIMETYPE="image/png" ! ! ! USE="nutz"> ! ! ! <FLocat LOCTYPE="URL" ! ! ! ! xlink:href="dao/31072_019/31072_019_001.png"/> ! ! </file> […] über TYPE-Attribute wird die Darstellung in der Benutzeroberfläche <structMap> gesteuert ! <div> ! ! <div ID="ID_SGF_31072_019-31072_019_001" TYPE="standard"> ! ! ! <fptr FILEID="FID_31072_31072_019-31072_019_001"/> ! ! </div> ! ! <div ID="ID_SGF_31072_019-31072_019_002" TYPE="bika" ! ! ! LABEL="Titelblatt"> ! ! ! <fptr FILEID="FID_31072_31072_019-31072_019_002"/> ! ! </div> Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
  • 14. Beispiel Imagedigitalisierung • Scannen von Zeitschriften • Ausgabe als TIFF, JPEG und PDF (mit hinterlegter OCR) • METS-Dateien zum Transport der Strukturdaten und zur Überprüfung auf Vollständigkeit und Integrität Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
  • 15. Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
  • 16. <mets:file ID="id3E491636EFE0923FE4EBC931B0E2F118" MIMETYPE="image/jpeg" SEQ="0" SIZE="5554162" CREATED="2011-01-31T22:03:28Z" CHECKSUM="AE563748136ACC3006493C744DA50031" CHECKSUMTYPE="MD5"> ! <mets:FLocat LOCTYPE="URL" xlink:href="SinglePageImagesBig0004.jpg"/> ! <mets:FContent> mit diesen Angaben kann geprüft werden, ob die Dateien ! ! <mets:xmlData> im Dateisystem bzw. auf der Festplatte unverändert sind ! ! ! <mix:mix> ! ! ! ! […] ! ! ! ! <mix:BasicImageInformation> ! ! ! ! ! <mix:BasicImageCharacteristics> ! ! ! ! ! ! <mix:imageWidth>4075</mix:imageWidth> ! ! ! ! ! ! <mix:imageHeight>5572</mix:imageHeight> ! ! ! ! ! ! <mix:PhotometricInterpretation> ! ! ! ! ! ! ! <mix:colorSpace>RGB</mix:colorSpace> ! ! ! ! ! ! </mix:PhotometricInterpretation> eingebundene MIX-Daten: ! ! ! ! ! </mix:BasicImageCharacteristics> technische Metadaten zum Dateiinhalt, hier Pixelmaße und ! ! ! ! </mix:BasicImageInformation> Farbtiefe ! ! ! ! […] Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
  • 17. Beispiel Image- und Volltextdigitalisierung • Scannen von Zeitschriften (durch SLUB) • Ausgabe der Images als TIFF und JPEG • Ausgabe der Volltexte als TEI • METS-Dateien aus TEI generiert, zur Darstellung im DFG-Viewer Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
  • 18. Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
  • 19. <mets:dmdSec ID="dMD32258227Z_pj001"> <mets:mdWrap MIMETYPE="text/xml" MDTYPE="MODS"> <mets:xmlData> <mods:mods> <mods:titleInfo> <mods:title>Polytechnisches Journal</mods:title> <mods:subTitle>Herausgegeben von Dr. Johann Gottfried Dingler, Chemiker und Fabrikanten etc. </mods:subTitle> <mods:subTitle>Mit 10 Kupfertafeln. </mods:subTitle> </mods:titleInfo> <mods:name type="personal"> <mods:displayForm authority="gnd">Dr. Johann Gottfried Dingler ! ! ! </mods:displayForm> <mods:namePart type="family">Dingler</mods:namePart> <mods:namePart type="given">Johann Gottfried</mods:namePart> <mods:namePart type="date">1778-1855</mods:namePart> […] eingebundene MODS-Daten mit bibliographischen Angaben Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
  • 20. <mets:structMap TYPE="LOGICAL"> ! <mets:div ID="LOGdiv32258227Zd4" TYPE="volume" Strukturdaten: Schachtelung von div-Elementen, Beschriftung in ! ! ! DMDID="dMD32258227Z_pj001" ADMID="aMD32258227Z" den LABEL-Attributen ! ! ! LABEL="Polytechnisches Journal. Band 1"> ! ! <mets:div ID="LOGdiv32258227Zd4e686" TYPE="titlePage" ! ! ! LABEL="Titelblatt" DMDID="dMD32258227Z_pj001"/> ! ! <mets:div ID="LOGdiv32258227Zd4e721" TYPE="preface" ! ! ! LABEL="Vorwort" DMDID="dMD32258227Z_pj001"/> ! ! <mets:div ID="LOGdiv32258227Zd4e761" TYPE="contents" ! ! ! LABEL="Inhaltsverzeichnis" DMDID="dMD32258227Z_pj001"/> ! ! <mets:div ID="LOGdiv32258227Zd4e1355" TYPE="issue" ! ! ! LABEL="Heft 1" DMDID="dMD32258227Z_is001001"> ! ! ! <mets:div ID="LOGdiv32258227Zd4e1358" TYPE="article" ! ! ! ! LABEL="I. Marechaux über die hydraulische Presse." ! ! ! ! DMDID="dMD32258227Z_ar001001"/> ! ! ! <mets:div ID="LOGdiv32258227Zd4e3254" TYPE="article" ! ! ! ! LABEL="III. Kurrer über den neuen Seidendruck mittelst ! ! ! ! ! ! örtlicher Farben." DMDID="dMD32258227Z_ar001003"/> Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
  • 21. METS bei Editura Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
  • 22. (unsere) Anwendungsfälle für METS • Präsentation offline • Präsentation online • Metadatentransport • Datenüberprüfung/Langzeitarchivierung • (Abrechnung) Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
  • 23. verwaltete Dateien • Images (Master und Derivate) als TIFF, JPEG, PNG, PDF usw. • Textdateien, teilweise strukturiert, als TXT, EAD, TEI usw. • HTML-Präsentationen • u.v.a. Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
  • 24. Arten von Metadaten • technische Metadaten • Dateipfade • Größe, Änderungsdatum, Checksumme • Informationen zum Inhalt: Mediatype, Pixelmaße, Auflösung, Farbprofil u.v.m. • inhaltlicheMetadaten • Strukturdaten • alle anderen beschreibenden Daten wie Angaben zu Bestand, Signatur, Autor Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
  • 25. Plädoyer für Strukturdaten • Technische Metadaten lassen sich sehr einfach erstellen, während inhaltliche Metadaten, besonders Strukturdaten, einen nennenswerten intellektuellen Aufwand erfordern. • Aber: Strukturdaten erschließen die Digitalisate und bestimmen i.d.R. die Darstellung und Navigation für Benutzer und tragen damit wesentlich zum Erfolg eines Imagedigitalisierungsprojektes bei. Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
  • 26. Photograph © Andrew Dunn – Website: http://www.andrewdunnphoto.com/ – CC-by-SA 2.0
  • 27. Profile • Profilelegen fest, wie die verfügbaren Elemente eingesetzt werden, um Daten abzubilden. Sie treffen eine Auswahl unter Alternativen. • Beispiele: • DFG-Viewer • MEX/MIDEX • weitereunter http://www.loc.gov/standards/mets/ mets-profiles.html Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
  • 28. Einsatz von METS-Profilen bei Editura • alle Profile, die unsere Kunden benötigen • ImZweifel bevorzugen wir die richtige Darstellung auf dem Zielsystem ggü. der »richtigen« Semantik. • eigenesProfil für Archivierung, eigene Software zur METS-Erzeugung und Überprüfung archivierter Dateien Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
  • 29. unsere Wünsche an ein Profil • ein Profil; wenige Pflichtelemente, unterschiedliche Anwendungsfälle durch optionale Elemente abdecken • eherweniger Funktionen resp. Elemente und Attribute, diese aber überall vollständig unterstützt • dauerhafte Pflege des Profils (Präzisierungen, Aktualisierungen, Dokumentation) • Schema zur Validierung der Daten Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
  • 30. unsere Wünsche an eine Software • vollständige Unterstützung des jeweiligen Profils • Erzeugung von offline-fähigen Präsentationen, d.h. ohne Internetzugang und Serverunterstützung ausführbar • Präsentation unterstützt Deep-Links, d.h. Sprung zu einem konkreten Image, mit Aufbau des Kontextes • Datei-Überprüfung und Statistik Stefan Krause • Editura GmbH & Co. KG, Berlin • http://www.editura.de
  • 31. DIGITALISIERUNG ALS DIENSTLEISTUNG Images, Metadaten, Strukturdaten Herzlichen Dank für Ihre Aufmerksamkeit! • Photograph © Andrew Dunn – Website: http://www.andrewdunnphoto.com/ – CC-by-SA 2.0 Stefan Krause Editura GmbH & Co. KG, Berlin http://www.editura.de

Hinweis der Redaktion

  1. \n
  2. \n
  3. \n
  4. \n
  5. \n
  6. \n
  7. \n
  8. \n
  9. \n
  10. \n
  11. \n
  12. \n
  13. \n
  14. \n
  15. \n
  16. \n
  17. \n
  18. \n
  19. \n
  20. \n
  21. \n
  22. \n
  23. \n
  24. \n
  25. \n
  26. \n
  27. \n
  28. \n
  29. \n
  30. \n
  31. \n