SlideShare ist ein Scribd-Unternehmen logo
Quelle in KSW-Celeste bold,weiß, 10pt
Ablösung eines existierenden DMS und Massenimport von
Digitalisatenund Metadaten inGoobi
Quelle in KSW-Celeste bold,weiß, 10pt
Vorgängersystem:
DMS „Monographien Digital“ (DIGIMO)
Gründe für Wechsel:
• FehlendeStandard-Schnittstellen(z.B. OAI)
• FehlendeUnterstützungvon Standard-Austauschformaten (z.B.
METS/MODS)
• URN-Vergabe nicht möglich
Quelle in KSW-Celeste bold,weiß, 10pt
Vorgängersystem:
DMS „Monographien Digital“ (DIGIMO)
Quelle in KSW-Celeste bold,weiß, 10pt
Datenmigration
Datenbestandzum Zeitpunktder Migration:
19.000 Vorgänge
2.1 MillionenDateien
60 TB Datenvolumen
Quelle in KSW-Celeste bold,weiß, 10pt
Zeithorizont
Entwicklungdes Importmodules: ab 2014
Beginnder Testläufe:August 2015
Beginn der Datenmigration:Dezember 2015
Ende der Datenmigration:August 2016
Ende derKorrekturen/Nacharbeiten:… ?
Quelle in KSW-Celeste bold,weiß, 10pt
Workflow
Quelle in KSW-Celeste bold,weiß, 10pt
Mapping von Strukturelementen
Quelle in KSW-Celeste bold,weiß, 10pt
Mapping von Strukturelementen
• Digimo verzichtete auf starre
Hierarchie der Strukturelemente
• Anpassung an Goobi-Regularien
erst während des Importes
möglich
Quelle in KSW-Celeste bold,weiß, 10pt
Mapping von Strukturelementen
Log-Datei mit Fehlermeldungen
• Fehlende
Verknüpfung
zum OPAC
• Doppelte
Identifier
• „falsche“
Abfolge von
Strukturtypen
Quelle in KSW-Celeste bold,weiß, 10pt
Migrationder Bilddateien
• Digimo verwaltete nur
Derivate und Thumbnails,
nicht die hochauflösenden
TIFF-Master.
• Es wurde überprüft, ob für
einen Datensatz Bilder im
TIFF-Format vorlagen.
• War ein TIFF-Ordner zu
dem Datensatz
vorhanden, und fehlte ein
Bild in diesem TIFF-
Ordner, wurde es aus
dem JPEG-Ordner
kopiert.
Quelle in KSW-Celeste bold,weiß, 10pt
Migrationder Bilddateien
CSV-Datei mit Dateipfad
Quelle in KSW-Celeste bold,weiß, 10pt
URN-Generierung
• URN-Vergabe erfolgt granular für Werke und für jedes
einzelneImage.
• Vergabe erfolgt im Workflow, Meldungan URN-Service der
DNB erst nach Abschluss des komplettenImportes und
Erledigung der relevanten Nacharbeiten.
• Eintrag im OPAC erfolgte perScript über VZG.
Quelle in KSW-Celeste bold,weiß, 10pt
URN-Generierung
•Ergänzungder URNinPICA-Kat.2050
•Änderung des Links in PICA-Kat.4083
Quelle in KSW-Celeste bold,weiß, 10pt
URN-Generierung
Unter Goobi erzeugter Datenbankabzug (Ausschnitt)
Vorgangstitel Dokumententyp EPN (Vorlage) URN
100ver_833512692 Monograph 833512692 urn:nbn:de:gbv:32-1-10005039555
101exl_755853474 Monograph 755853474 urn:nbn:de:gbv:32-1-10014785944
11kupf_146170253 MultiVolumeWork 146170253 urn:nbn:de:gbv:32-1-10013042384
11r15r_327088257 MultiVolumeWork 327088257 urn:nbn:de:gbv:32-1-10016300237
124lie_181064227 MultiVolumeWork 181064227 urn:nbn:de:gbv:32-1-10013572498
12blae_801088755 Monograph 801088755 urn:nbn:de:gbv:32-1-10001723731
12blae_801105676 Monograph 801105676 urn:nbn:de:gbv:32-1-10003967516
12blae_801107148 Monograph 801107148 urn:nbn:de:gbv:32-1-10003967408
12blae_803101171 Monograph 803101171 urn:nbn:de:gbv:32-1-10015381710
12blat_801109108 Monograph 801109108 urn:nbn:de:gbv:32-1-10003967622

Weitere ähnliche Inhalte

Mehr von intranda GmbH

Goobi viewer - Der lange Weg zu Open Source
Goobi viewer - Der lange Weg zu Open SourceGoobi viewer - Der lange Weg zu Open Source
Goobi viewer - Der lange Weg zu Open Source
intranda GmbH
 
Goobi-viewer-Tag 2019 - Viel zu tun: Geheimbaustellen und Ideen für die nächs...
Goobi-viewer-Tag 2019 - Viel zu tun: Geheimbaustellen und Ideen für die nächs...Goobi-viewer-Tag 2019 - Viel zu tun: Geheimbaustellen und Ideen für die nächs...
Goobi-viewer-Tag 2019 - Viel zu tun: Geheimbaustellen und Ideen für die nächs...
intranda GmbH
 
Goobi-viewer-Tag 2019 - Willkommen
Goobi-viewer-Tag 2019 - WillkommenGoobi-viewer-Tag 2019 - Willkommen
Goobi-viewer-Tag 2019 - Willkommen
intranda GmbH
 
Goobi-viewer-Tag 2019 - Goobi viewer 4.0 - What happened?
Goobi-viewer-Tag 2019 - Goobi viewer 4.0 - What happened?Goobi-viewer-Tag 2019 - Goobi viewer 4.0 - What happened?
Goobi-viewer-Tag 2019 - Goobi viewer 4.0 - What happened?
intranda GmbH
 
Goobi-Tage 2019 - Goobi workflow Entwicklungsrückblick über die letzten 12 M...
Goobi-Tage 2019 -  Goobi workflow Entwicklungsrückblick über die letzten 12 M...Goobi-Tage 2019 -  Goobi workflow Entwicklungsrückblick über die letzten 12 M...
Goobi-Tage 2019 - Goobi workflow Entwicklungsrückblick über die letzten 12 M...
intranda GmbH
 
Goobi-workflow-Tag 2019 - Willkommen
Goobi-workflow-Tag 2019 - WillkommenGoobi-workflow-Tag 2019 - Willkommen
Goobi-workflow-Tag 2019 - Willkommen
intranda GmbH
 
Goobi-Tag 2020 - Ausblick
Goobi-Tag 2020 - AusblickGoobi-Tag 2020 - Ausblick
Goobi-Tag 2020 - Ausblick
intranda GmbH
 
Goobi-Tag 2020 - Willkommen
Goobi-Tag 2020 - WillkommenGoobi-Tag 2020 - Willkommen
Goobi-Tag 2020 - Willkommen
intranda GmbH
 
Goobi-Tag 2020 - Goobi workflow Entwicklungsrückblick
Goobi-Tag 2020 - Goobi workflow EntwicklungsrückblickGoobi-Tag 2020 - Goobi workflow Entwicklungsrückblick
Goobi-Tag 2020 - Goobi workflow Entwicklungsrückblick
intranda GmbH
 
Goobi-Tage 2019 - Goobi 19.09 under the Hood
Goobi-Tage 2019 - Goobi 19.09 under the HoodGoobi-Tage 2019 - Goobi 19.09 under the Hood
Goobi-Tage 2019 - Goobi 19.09 under the Hood
intranda GmbH
 
Goobi-Tag 2021 - Ausblick
Goobi-Tag 2021 - AusblickGoobi-Tag 2021 - Ausblick
Goobi-Tag 2021 - Ausblick
intranda GmbH
 
Goobi-Tag 2020 - Entwicklungsrückblick Goobi viewer
Goobi-Tag 2020 - Entwicklungsrückblick Goobi viewerGoobi-Tag 2020 - Entwicklungsrückblick Goobi viewer
Goobi-Tag 2020 - Entwicklungsrückblick Goobi viewer
intranda GmbH
 
Goobi-Tag 2021 - Entwicklungsrückblick Goobi viewer
Goobi-Tag 2021 - Entwicklungsrückblick Goobi viewerGoobi-Tag 2021 - Entwicklungsrückblick Goobi viewer
Goobi-Tag 2021 - Entwicklungsrückblick Goobi viewer
intranda GmbH
 
Goobi-Tage 2019 - Die neue intranda OCR Pipeline
Goobi-Tage 2019 - Die neue intranda OCR PipelineGoobi-Tage 2019 - Die neue intranda OCR Pipeline
Goobi-Tage 2019 - Die neue intranda OCR Pipeline
intranda GmbH
 
Goobi-Tag 2021 - (Semi-) Automatische Strukturerkennung
Goobi-Tag 2021 - (Semi-) Automatische StrukturerkennungGoobi-Tag 2021 - (Semi-) Automatische Strukturerkennung
Goobi-Tag 2021 - (Semi-) Automatische Strukturerkennung
intranda GmbH
 
Goobi-Tag 2021 - Der intranda OCR-Service
Goobi-Tag 2021 - Der intranda OCR-ServiceGoobi-Tag 2021 - Der intranda OCR-Service
Goobi-Tag 2021 - Der intranda OCR-Service
intranda GmbH
 
Goobi-Tag 2021 - Rückblick Goobi workflow
Goobi-Tag 2021 - Rückblick Goobi workflowGoobi-Tag 2021 - Rückblick Goobi workflow
Goobi-Tag 2021 - Rückblick Goobi workflow
intranda GmbH
 
Goobi-Tag 2021 - Willkommen
Goobi-Tag 2021 - WillkommenGoobi-Tag 2021 - Willkommen
Goobi-Tag 2021 - Willkommen
intranda GmbH
 
OCR Qualität objektiv gemessen
OCR Qualität objektiv gemessenOCR Qualität objektiv gemessen
OCR Qualität objektiv gemessen
intranda GmbH
 
Ich glaub es hackt! – Ein Teilnehmerbericht vom Kultur-Hackathon Coding da Vi...
Ich glaub es hackt! – Ein Teilnehmerbericht vom Kultur-Hackathon Coding da Vi...Ich glaub es hackt! – Ein Teilnehmerbericht vom Kultur-Hackathon Coding da Vi...
Ich glaub es hackt! – Ein Teilnehmerbericht vom Kultur-Hackathon Coding da Vi...
intranda GmbH
 

Mehr von intranda GmbH (20)

Goobi viewer - Der lange Weg zu Open Source
Goobi viewer - Der lange Weg zu Open SourceGoobi viewer - Der lange Weg zu Open Source
Goobi viewer - Der lange Weg zu Open Source
 
Goobi-viewer-Tag 2019 - Viel zu tun: Geheimbaustellen und Ideen für die nächs...
Goobi-viewer-Tag 2019 - Viel zu tun: Geheimbaustellen und Ideen für die nächs...Goobi-viewer-Tag 2019 - Viel zu tun: Geheimbaustellen und Ideen für die nächs...
Goobi-viewer-Tag 2019 - Viel zu tun: Geheimbaustellen und Ideen für die nächs...
 
Goobi-viewer-Tag 2019 - Willkommen
Goobi-viewer-Tag 2019 - WillkommenGoobi-viewer-Tag 2019 - Willkommen
Goobi-viewer-Tag 2019 - Willkommen
 
Goobi-viewer-Tag 2019 - Goobi viewer 4.0 - What happened?
Goobi-viewer-Tag 2019 - Goobi viewer 4.0 - What happened?Goobi-viewer-Tag 2019 - Goobi viewer 4.0 - What happened?
Goobi-viewer-Tag 2019 - Goobi viewer 4.0 - What happened?
 
Goobi-Tage 2019 - Goobi workflow Entwicklungsrückblick über die letzten 12 M...
Goobi-Tage 2019 -  Goobi workflow Entwicklungsrückblick über die letzten 12 M...Goobi-Tage 2019 -  Goobi workflow Entwicklungsrückblick über die letzten 12 M...
Goobi-Tage 2019 - Goobi workflow Entwicklungsrückblick über die letzten 12 M...
 
Goobi-workflow-Tag 2019 - Willkommen
Goobi-workflow-Tag 2019 - WillkommenGoobi-workflow-Tag 2019 - Willkommen
Goobi-workflow-Tag 2019 - Willkommen
 
Goobi-Tag 2020 - Ausblick
Goobi-Tag 2020 - AusblickGoobi-Tag 2020 - Ausblick
Goobi-Tag 2020 - Ausblick
 
Goobi-Tag 2020 - Willkommen
Goobi-Tag 2020 - WillkommenGoobi-Tag 2020 - Willkommen
Goobi-Tag 2020 - Willkommen
 
Goobi-Tag 2020 - Goobi workflow Entwicklungsrückblick
Goobi-Tag 2020 - Goobi workflow EntwicklungsrückblickGoobi-Tag 2020 - Goobi workflow Entwicklungsrückblick
Goobi-Tag 2020 - Goobi workflow Entwicklungsrückblick
 
Goobi-Tage 2019 - Goobi 19.09 under the Hood
Goobi-Tage 2019 - Goobi 19.09 under the HoodGoobi-Tage 2019 - Goobi 19.09 under the Hood
Goobi-Tage 2019 - Goobi 19.09 under the Hood
 
Goobi-Tag 2021 - Ausblick
Goobi-Tag 2021 - AusblickGoobi-Tag 2021 - Ausblick
Goobi-Tag 2021 - Ausblick
 
Goobi-Tag 2020 - Entwicklungsrückblick Goobi viewer
Goobi-Tag 2020 - Entwicklungsrückblick Goobi viewerGoobi-Tag 2020 - Entwicklungsrückblick Goobi viewer
Goobi-Tag 2020 - Entwicklungsrückblick Goobi viewer
 
Goobi-Tag 2021 - Entwicklungsrückblick Goobi viewer
Goobi-Tag 2021 - Entwicklungsrückblick Goobi viewerGoobi-Tag 2021 - Entwicklungsrückblick Goobi viewer
Goobi-Tag 2021 - Entwicklungsrückblick Goobi viewer
 
Goobi-Tage 2019 - Die neue intranda OCR Pipeline
Goobi-Tage 2019 - Die neue intranda OCR PipelineGoobi-Tage 2019 - Die neue intranda OCR Pipeline
Goobi-Tage 2019 - Die neue intranda OCR Pipeline
 
Goobi-Tag 2021 - (Semi-) Automatische Strukturerkennung
Goobi-Tag 2021 - (Semi-) Automatische StrukturerkennungGoobi-Tag 2021 - (Semi-) Automatische Strukturerkennung
Goobi-Tag 2021 - (Semi-) Automatische Strukturerkennung
 
Goobi-Tag 2021 - Der intranda OCR-Service
Goobi-Tag 2021 - Der intranda OCR-ServiceGoobi-Tag 2021 - Der intranda OCR-Service
Goobi-Tag 2021 - Der intranda OCR-Service
 
Goobi-Tag 2021 - Rückblick Goobi workflow
Goobi-Tag 2021 - Rückblick Goobi workflowGoobi-Tag 2021 - Rückblick Goobi workflow
Goobi-Tag 2021 - Rückblick Goobi workflow
 
Goobi-Tag 2021 - Willkommen
Goobi-Tag 2021 - WillkommenGoobi-Tag 2021 - Willkommen
Goobi-Tag 2021 - Willkommen
 
OCR Qualität objektiv gemessen
OCR Qualität objektiv gemessenOCR Qualität objektiv gemessen
OCR Qualität objektiv gemessen
 
Ich glaub es hackt! – Ein Teilnehmerbericht vom Kultur-Hackathon Coding da Vi...
Ich glaub es hackt! – Ein Teilnehmerbericht vom Kultur-Hackathon Coding da Vi...Ich glaub es hackt! – Ein Teilnehmerbericht vom Kultur-Hackathon Coding da Vi...
Ich glaub es hackt! – Ein Teilnehmerbericht vom Kultur-Hackathon Coding da Vi...
 

Ablösung eines existierenden DMS und Massenimport von Digitalisaten und Metadaten in Goobi

  • 1. Quelle in KSW-Celeste bold,weiß, 10pt Ablösung eines existierenden DMS und Massenimport von Digitalisatenund Metadaten inGoobi
  • 2. Quelle in KSW-Celeste bold,weiß, 10pt Vorgängersystem: DMS „Monographien Digital“ (DIGIMO) Gründe für Wechsel: • FehlendeStandard-Schnittstellen(z.B. OAI) • FehlendeUnterstützungvon Standard-Austauschformaten (z.B. METS/MODS) • URN-Vergabe nicht möglich
  • 3. Quelle in KSW-Celeste bold,weiß, 10pt Vorgängersystem: DMS „Monographien Digital“ (DIGIMO)
  • 4. Quelle in KSW-Celeste bold,weiß, 10pt Datenmigration Datenbestandzum Zeitpunktder Migration: 19.000 Vorgänge 2.1 MillionenDateien 60 TB Datenvolumen
  • 5. Quelle in KSW-Celeste bold,weiß, 10pt Zeithorizont Entwicklungdes Importmodules: ab 2014 Beginnder Testläufe:August 2015 Beginn der Datenmigration:Dezember 2015 Ende der Datenmigration:August 2016 Ende derKorrekturen/Nacharbeiten:… ?
  • 6. Quelle in KSW-Celeste bold,weiß, 10pt Workflow
  • 7. Quelle in KSW-Celeste bold,weiß, 10pt Mapping von Strukturelementen
  • 8. Quelle in KSW-Celeste bold,weiß, 10pt Mapping von Strukturelementen • Digimo verzichtete auf starre Hierarchie der Strukturelemente • Anpassung an Goobi-Regularien erst während des Importes möglich
  • 9. Quelle in KSW-Celeste bold,weiß, 10pt Mapping von Strukturelementen Log-Datei mit Fehlermeldungen • Fehlende Verknüpfung zum OPAC • Doppelte Identifier • „falsche“ Abfolge von Strukturtypen
  • 10. Quelle in KSW-Celeste bold,weiß, 10pt Migrationder Bilddateien • Digimo verwaltete nur Derivate und Thumbnails, nicht die hochauflösenden TIFF-Master. • Es wurde überprüft, ob für einen Datensatz Bilder im TIFF-Format vorlagen. • War ein TIFF-Ordner zu dem Datensatz vorhanden, und fehlte ein Bild in diesem TIFF- Ordner, wurde es aus dem JPEG-Ordner kopiert.
  • 11. Quelle in KSW-Celeste bold,weiß, 10pt Migrationder Bilddateien CSV-Datei mit Dateipfad
  • 12. Quelle in KSW-Celeste bold,weiß, 10pt URN-Generierung • URN-Vergabe erfolgt granular für Werke und für jedes einzelneImage. • Vergabe erfolgt im Workflow, Meldungan URN-Service der DNB erst nach Abschluss des komplettenImportes und Erledigung der relevanten Nacharbeiten. • Eintrag im OPAC erfolgte perScript über VZG.
  • 13. Quelle in KSW-Celeste bold,weiß, 10pt URN-Generierung •Ergänzungder URNinPICA-Kat.2050 •Änderung des Links in PICA-Kat.4083
  • 14. Quelle in KSW-Celeste bold,weiß, 10pt URN-Generierung Unter Goobi erzeugter Datenbankabzug (Ausschnitt) Vorgangstitel Dokumententyp EPN (Vorlage) URN 100ver_833512692 Monograph 833512692 urn:nbn:de:gbv:32-1-10005039555 101exl_755853474 Monograph 755853474 urn:nbn:de:gbv:32-1-10014785944 11kupf_146170253 MultiVolumeWork 146170253 urn:nbn:de:gbv:32-1-10013042384 11r15r_327088257 MultiVolumeWork 327088257 urn:nbn:de:gbv:32-1-10016300237 124lie_181064227 MultiVolumeWork 181064227 urn:nbn:de:gbv:32-1-10013572498 12blae_801088755 Monograph 801088755 urn:nbn:de:gbv:32-1-10001723731 12blae_801105676 Monograph 801105676 urn:nbn:de:gbv:32-1-10003967516 12blae_801107148 Monograph 801107148 urn:nbn:de:gbv:32-1-10003967408 12blae_803101171 Monograph 803101171 urn:nbn:de:gbv:32-1-10015381710 12blat_801109108 Monograph 801109108 urn:nbn:de:gbv:32-1-10003967622