SlideShare ist ein Scribd-Unternehmen logo
Ist Langzeitarchivierung
           finanzierbar?
       Überlegungen zur Produktion
     langzeitarchivierbarer Objekte


   Ralf Stockmann, Göttinger Digitalisierungszentrum
Langzeitarchivierung –
    Was kostet es, nichts zu tun?
• Dr. Ross King
  Austrian Research Centers
• Kosten für (vergebliche) Produktion, Anzahl
  relevanter Dokumente, Halbwertzeit von
  Dokumentenformaten
• Für den EU-Raum:
Das Göttinger
    Digitalisierungszentrum (GDZ)
• Abteilung der Staats- und Universitätsbibliothek Göttingen (SUB)
• Nationales und Internationales Service- und Kompetenzzentrum seit
  1997 - zu Beginn gefördert von der Deutschen
  Forschungsgemeinschaft (DFG)
• Entwicklung eines Produktionsworkflows für große Mengen an
  Digitalisaten im Printbereich
• Standardisierungsaktivitäten (METS)
• Mehr als 6 Millionen Seiten digitalisiert, über 4 Millionen Seiten
  online bereitgestellt
• Konzeption, Beratung und Durchführung von Projekten (häufig
  kooperativ)
• Zielsetzung: Masse UND Klasse
Gliederung
•   Ebenen der LZA
•   Komponenten und Kostenfaktoren der LZA
•   Kostenrechnung
•   Empfehlungen
Ebenen der LZA
• Bitstream Preservation (Hardware)
  – Integrität der Dateien erhalten
• Inhalte im Zugriff halten (Software)
  – Nutzung/Bedeutung der Datei erhalten
  – Migration
  – Emulation
Komponenten und Kostenfaktoren
• Dateiformate
• Produktionswerkzeuge
• Metadaten
• LZA-Management System (für Migration,
  Emulation)
• Storage (4-fach redundant)
Produktionworkflow
                   (Digitalisierung)

                            Image
 Selection                                                 PDF Rendering,                Upload,
              Scanning   Optimization    Quality Control                    Metadata
(Bookshelf)              Processing                         OCR, backup                 CMS / DMS




                                förderungsfähig


 Selection                                                               Upload
                                        Produktion                                     LZA
(Bookshelf)                                                             CMS / DMS
Kostenfaktoren

                   Image
                                                  PDF Rendering,                    Upload /
   Scanning   OptimizationPro   Quality Control                      Metadata
                                                   OCR, backup                       LZA
                  cessing




Dateiformat   Header            Log               PDF/A            Format        Archivobjekt

JPG           Software                            Software         ZVDD-METS     Ingest
TIFF                                                               EAD
(FAXG4)                                                            MuseumDAT     Storage
JPG2000
3D-Scan                                                            LZA: PREMIS   Updates

Header                                                                           Migration

Hardware

Software
Kosten entstehen durch…
• Weiche Kosten
  – Change Management Prozesse
  – Wechsel des Workflow, Schulungen auf neue
    Tools und Verfahren, …
• Harte Kosten
  – Anschaffungen
  – Software, Lizenzen
  – Hardware (Storage, RAID-Systeme)
Kosten Software LZA
• Produktionssysteme
  – Open Source (Supportkosten)
     • Goobi (GDZ)
  – Kommerziell (Lizenzkosten)
     • ZENDpro (MDZ)
     • Semantics
     • CCS
  – Ziel: ingestfähige LZA Pakete
• LZA Systeme
  – LOCKSS (open source)
  – KOPAL (DNB/SUB/IBM)
  –…
Beispielrechnung Storage
• Lizenzgebühren LZA Software
  – 40.000 € p.a.
  – 100 TB LZA-Storage: 25.000 € einmalig
     • 4-fach redundant
     • Tape
• 1TB = 250 €
  – Platz für 62.000 unkomprimierte TIFF Bilder A5 (16
    MB pro Seite)
  – Kosten GDZ Jahresproduktion (3 Mio Seiten): ca.
    20.000 €
• Kosten pro Seite: ca. 2 Cent
• Ca. 10% der Gesamtkosten
Dienstleistungs-Infrastruktur
• Der Aufbau eigener LZA-Archive ist wenig
  ratsam
• Dienstleister:
  – GWDG (KOPAL, DNB, SUB)
  – Leibnitz RZ (BSB)
  – Angebote noch nicht im Dauerbetrieb getestet
Werkzeuge für Format-
                 Validierung
JHOVE (JSTOR/Harvard Object Validation Environment)
Konformitätsvalidierung für:
– AIFF, AIFF-C
– ASCII
– GIF 87a, 89a
– HTML 3.2, 4.0, 4.01, XHTML 1.0, 1.1
– JPEG, JFIF, SPIFF, JTIP, JPEG-LS, Exif 2.0, 2.1, 2.2
– JPEG 2000 JP2, JPX
– PDF 1.0 – 1.6, PDF/X-1, -1a, -2, -3, PDF/A, Tagged PDF, Linearized PDF
– TIFF 4.0 – 6.0, Class B, G, P, R, Y, F, RFC 1314, TIFF/EP, TIFF/IT (CT, LW, HC,
    MP, BP, BL, FP, and P1, P2), GeoTIFF, TIFF-FX, Exif 2.0, 2.1, 2.2, DNG
– UTF-8
– WAVE, BWF
– XML

http://hul.harvard.edu/jhove/
http://www.nationalarchives.gov.uk/pronom/
Empfehlungen
• Vorsicht vor proprietären Formaten
• Formate/Metadaten jetzt umstellen, jeder Tag
  Verzug führt zu höheren Kosten
• Bitstream Preservation jetzt garantieren
  (LOCKS, RAID, Verbund)
• LZA Archivsysteme: abwarten bis Marktreif
  erwiesen und Konsolidierung erreicht
• Auf dem Laufenden bleiben:
  – www.nestor.sub.uni-goettingen.de
Vielen Dank

Weitere ähnliche Inhalte

Andere mochten auch

Mejores lugares para tomarse whisky.pptx nora graciela modolo
Mejores lugares para tomarse whisky.pptx nora graciela modoloMejores lugares para tomarse whisky.pptx nora graciela modolo
Mejores lugares para tomarse whisky.pptx nora graciela modolo
PerlaSarubbi
 
Tipos de bases de datos
Tipos de bases de datosTipos de bases de datos
Tipos de bases de datos
Cesarcarrascocevallos
 
La función de nutrición
La función de nutriciónLa función de nutrición
La función de nutrición
jcrerey
 
Atelier Alicante - Revista de moda on-line
Atelier Alicante - Revista de moda on-lineAtelier Alicante - Revista de moda on-line
Atelier Alicante - Revista de moda on-line
Atelier Alicante
 
Taller de informática n° 2
Taller de informática n° 2Taller de informática n° 2
Taller de informática n° 2
faiberivan
 
Agricultura Urbana Grupo 2
Agricultura Urbana Grupo 2Agricultura Urbana Grupo 2
Agricultura Urbana Grupo 2
AKS816
 
La Disciplina
 La Disciplina La Disciplina
La Disciplina
73022039
 
Aprendizaje en la red 2.0
Aprendizaje en la red 2.0Aprendizaje en la red 2.0
Aprendizaje en la red 2.0
gise_mgta
 
Tercer domingo de cuaresma
Tercer domingo de cuaresmaTercer domingo de cuaresma
Tercer domingo de cuaresma
Voluntariado A IC
 
Los seres vivos
Los seres vivosLos seres vivos
Los seres vivos
tercerciclocantavieja
 
SKETCHES SHANGHAI
SKETCHES SHANGHAISKETCHES SHANGHAI
SKETCHES SHANGHAI
Elisabeth Hill
 
Executive Master of International Business – SMBS University of Salzburg Busi...
Executive Master of International Business – SMBS University of Salzburg Busi...Executive Master of International Business – SMBS University of Salzburg Busi...
Executive Master of International Business – SMBS University of Salzburg Busi...
SMBS University of Salzburg Business School
 
Trabajo de informatica
Trabajo de informaticaTrabajo de informatica
Trabajo de informatica
Miguell Kssttro
 
Ost 1 10026 80
Ost 1 10026 80Ost 1 10026 80
Ost 1 10026 80fun_gai
 
Enseñanza tradicional.ppt alfonso avila a
Enseñanza tradicional.ppt alfonso avila aEnseñanza tradicional.ppt alfonso avila a
Enseñanza tradicional.ppt alfonso avila a
ALFONSOAVILAAGUIRRE
 
CSS3 im praktischen Einsatz
CSS3 im praktischen EinsatzCSS3 im praktischen Einsatz
CSS3 im praktischen Einsatz
Sven Wolfermann
 
Die Generation Foodie
Die Generation FoodieDie Generation Foodie
Die Generation Foodie
taste_Offenbach
 
comentario n v i español
comentario n v i español comentario n v i español
comentario n v i español
marvin sanchez
 
HACEMOS LEMA
HACEMOS LEMAHACEMOS LEMA
HACEMOS LEMAMily29
 

Andere mochten auch (20)

Mejores lugares para tomarse whisky.pptx nora graciela modolo
Mejores lugares para tomarse whisky.pptx nora graciela modoloMejores lugares para tomarse whisky.pptx nora graciela modolo
Mejores lugares para tomarse whisky.pptx nora graciela modolo
 
Tipos de bases de datos
Tipos de bases de datosTipos de bases de datos
Tipos de bases de datos
 
La función de nutrición
La función de nutriciónLa función de nutrición
La función de nutrición
 
Atelier Alicante - Revista de moda on-line
Atelier Alicante - Revista de moda on-lineAtelier Alicante - Revista de moda on-line
Atelier Alicante - Revista de moda on-line
 
Taller de informática n° 2
Taller de informática n° 2Taller de informática n° 2
Taller de informática n° 2
 
Agricultura Urbana Grupo 2
Agricultura Urbana Grupo 2Agricultura Urbana Grupo 2
Agricultura Urbana Grupo 2
 
La Disciplina
 La Disciplina La Disciplina
La Disciplina
 
(U)
(U)(U)
(U)
 
Aprendizaje en la red 2.0
Aprendizaje en la red 2.0Aprendizaje en la red 2.0
Aprendizaje en la red 2.0
 
Tercer domingo de cuaresma
Tercer domingo de cuaresmaTercer domingo de cuaresma
Tercer domingo de cuaresma
 
Los seres vivos
Los seres vivosLos seres vivos
Los seres vivos
 
SKETCHES SHANGHAI
SKETCHES SHANGHAISKETCHES SHANGHAI
SKETCHES SHANGHAI
 
Executive Master of International Business – SMBS University of Salzburg Busi...
Executive Master of International Business – SMBS University of Salzburg Busi...Executive Master of International Business – SMBS University of Salzburg Busi...
Executive Master of International Business – SMBS University of Salzburg Busi...
 
Trabajo de informatica
Trabajo de informaticaTrabajo de informatica
Trabajo de informatica
 
Ost 1 10026 80
Ost 1 10026 80Ost 1 10026 80
Ost 1 10026 80
 
Enseñanza tradicional.ppt alfonso avila a
Enseñanza tradicional.ppt alfonso avila aEnseñanza tradicional.ppt alfonso avila a
Enseñanza tradicional.ppt alfonso avila a
 
CSS3 im praktischen Einsatz
CSS3 im praktischen EinsatzCSS3 im praktischen Einsatz
CSS3 im praktischen Einsatz
 
Die Generation Foodie
Die Generation FoodieDie Generation Foodie
Die Generation Foodie
 
comentario n v i español
comentario n v i español comentario n v i español
comentario n v i español
 
HACEMOS LEMA
HACEMOS LEMAHACEMOS LEMA
HACEMOS LEMA
 

Ähnlich wie Ist Langzeitarchivierung finanzierbar? Präsentation Akademie Sankelmark 2008

Fit für die digitale Bibliothek? (2007)
Fit für die digitale Bibliothek? (2007)Fit für die digitale Bibliothek? (2007)
Fit für die digitale Bibliothek? (2007)Ralf Stockmann
 
Medienverwaltung ZKI-Hamburg
Medienverwaltung ZKI-HamburgMedienverwaltung ZKI-Hamburg
Medienverwaltung ZKI-Hamburg
Sergei Pachtchenko
 
Kooperative Angebote von GBV und GDZ im Bereich Digitalisierung
Kooperative Angebote von GBV und GDZ im Bereich DigitalisierungKooperative Angebote von GBV und GDZ im Bereich Digitalisierung
Kooperative Angebote von GBV und GDZ im Bereich DigitalisierungRalf Stockmann
 
NSI Autostore
NSI Autostore NSI Autostore
NSI Autostore
Thomas Moser
 
Workfloworchestrierung Massendigitalisierung
Workfloworchestrierung MassendigitalisierungWorkfloworchestrierung Massendigitalisierung
Workfloworchestrierung MassendigitalisierungRalf Stockmann
 
PrintTalk 2.0, XJDF & WebToPrint
PrintTalk 2.0, XJDF & WebToPrintPrintTalk 2.0, XJDF & WebToPrint
PrintTalk 2.0, XJDF & WebToPrint
Stefan Meissner
 
Industry-forum 2011 eCATALOGsolutions TURCK
Industry-forum 2011 eCATALOGsolutions TURCKIndustry-forum 2011 eCATALOGsolutions TURCK
Industry-forum 2011 eCATALOGsolutions TURCK
CADENAS
 
InDesign und XML – wie geht’s weiter?
InDesign und XML – wie geht’s weiter?InDesign und XML – wie geht’s weiter?
InDesign und XML – wie geht’s weiter?
Gregor Fellenz
 
B3 Lotusday Mbg Mailarchivierung
B3 Lotusday Mbg MailarchivierungB3 Lotusday Mbg Mailarchivierung
B3 Lotusday Mbg Mailarchivierung
Andreas Schulte
 
SaaS Web 2.0 Dokumentenmanagement
SaaS Web 2.0 Dokumentenmanagement SaaS Web 2.0 Dokumentenmanagement
SaaS Web 2.0 Dokumentenmanagement
Bjoern Reinhold
 
Dokumentenmanagement als SaaS, Dokumentenmanagement SaaS
Dokumentenmanagement als SaaS, Dokumentenmanagement SaaSDokumentenmanagement als SaaS, Dokumentenmanagement SaaS
Dokumentenmanagement als SaaS, Dokumentenmanagement SaaS
GBS PAVONE Groupware GmbH
 
InDesign Roboter @Swiss Publishing Week 2011
InDesign Roboter @Swiss Publishing Week 2011InDesign Roboter @Swiss Publishing Week 2011
InDesign Roboter @Swiss Publishing Week 2011
Gregor Fellenz
 
biz²ScanServer Produktpräsentation
biz²ScanServer Produktpräsentation biz²ScanServer Produktpräsentation
biz²ScanServer Produktpräsentation
inPuncto GmbH
 
2009 Vortrag digitales Depot
2009 Vortrag digitales Depot2009 Vortrag digitales Depot
2009 Vortrag digitales Depot
Jörg Oyen
 
Goobi Präsentation Darmstadt 2009
Goobi Präsentation Darmstadt 2009Goobi Präsentation Darmstadt 2009
Goobi Präsentation Darmstadt 2009
Ralf Stockmann
 
SUB OCR Implementierung
SUB OCR ImplementierungSUB OCR Implementierung
SUB OCR Implementierungcmahnke
 
Tom Gansor: Agile Business Intelligence
Tom Gansor: Agile Business IntelligenceTom Gansor: Agile Business Intelligence
Tom Gansor: Agile Business Intelligence
Stephan Trahasch
 
Sun Summit Scan2Web
Sun Summit Scan2WebSun Summit Scan2Web
Sun Summit Scan2Web
intelligentinfo
 
B1 Lotusday 2008 Vortrag X Forms Rapid Development
B1 Lotusday 2008 Vortrag X Forms Rapid DevelopmentB1 Lotusday 2008 Vortrag X Forms Rapid Development
B1 Lotusday 2008 Vortrag X Forms Rapid Development
Andreas Schulte
 

Ähnlich wie Ist Langzeitarchivierung finanzierbar? Präsentation Akademie Sankelmark 2008 (20)

Fit für die digitale Bibliothek? (2007)
Fit für die digitale Bibliothek? (2007)Fit für die digitale Bibliothek? (2007)
Fit für die digitale Bibliothek? (2007)
 
Medienverwaltung ZKI-Hamburg
Medienverwaltung ZKI-HamburgMedienverwaltung ZKI-Hamburg
Medienverwaltung ZKI-Hamburg
 
Kooperative Angebote von GBV und GDZ im Bereich Digitalisierung
Kooperative Angebote von GBV und GDZ im Bereich DigitalisierungKooperative Angebote von GBV und GDZ im Bereich Digitalisierung
Kooperative Angebote von GBV und GDZ im Bereich Digitalisierung
 
Datamatics Verlagspräsentation (2010)
Datamatics Verlagspräsentation (2010)Datamatics Verlagspräsentation (2010)
Datamatics Verlagspräsentation (2010)
 
NSI Autostore
NSI Autostore NSI Autostore
NSI Autostore
 
Workfloworchestrierung Massendigitalisierung
Workfloworchestrierung MassendigitalisierungWorkfloworchestrierung Massendigitalisierung
Workfloworchestrierung Massendigitalisierung
 
PrintTalk 2.0, XJDF & WebToPrint
PrintTalk 2.0, XJDF & WebToPrintPrintTalk 2.0, XJDF & WebToPrint
PrintTalk 2.0, XJDF & WebToPrint
 
Industry-forum 2011 eCATALOGsolutions TURCK
Industry-forum 2011 eCATALOGsolutions TURCKIndustry-forum 2011 eCATALOGsolutions TURCK
Industry-forum 2011 eCATALOGsolutions TURCK
 
InDesign und XML – wie geht’s weiter?
InDesign und XML – wie geht’s weiter?InDesign und XML – wie geht’s weiter?
InDesign und XML – wie geht’s weiter?
 
B3 Lotusday Mbg Mailarchivierung
B3 Lotusday Mbg MailarchivierungB3 Lotusday Mbg Mailarchivierung
B3 Lotusday Mbg Mailarchivierung
 
SaaS Web 2.0 Dokumentenmanagement
SaaS Web 2.0 Dokumentenmanagement SaaS Web 2.0 Dokumentenmanagement
SaaS Web 2.0 Dokumentenmanagement
 
Dokumentenmanagement als SaaS, Dokumentenmanagement SaaS
Dokumentenmanagement als SaaS, Dokumentenmanagement SaaSDokumentenmanagement als SaaS, Dokumentenmanagement SaaS
Dokumentenmanagement als SaaS, Dokumentenmanagement SaaS
 
InDesign Roboter @Swiss Publishing Week 2011
InDesign Roboter @Swiss Publishing Week 2011InDesign Roboter @Swiss Publishing Week 2011
InDesign Roboter @Swiss Publishing Week 2011
 
biz²ScanServer Produktpräsentation
biz²ScanServer Produktpräsentation biz²ScanServer Produktpräsentation
biz²ScanServer Produktpräsentation
 
2009 Vortrag digitales Depot
2009 Vortrag digitales Depot2009 Vortrag digitales Depot
2009 Vortrag digitales Depot
 
Goobi Präsentation Darmstadt 2009
Goobi Präsentation Darmstadt 2009Goobi Präsentation Darmstadt 2009
Goobi Präsentation Darmstadt 2009
 
SUB OCR Implementierung
SUB OCR ImplementierungSUB OCR Implementierung
SUB OCR Implementierung
 
Tom Gansor: Agile Business Intelligence
Tom Gansor: Agile Business IntelligenceTom Gansor: Agile Business Intelligence
Tom Gansor: Agile Business Intelligence
 
Sun Summit Scan2Web
Sun Summit Scan2WebSun Summit Scan2Web
Sun Summit Scan2Web
 
B1 Lotusday 2008 Vortrag X Forms Rapid Development
B1 Lotusday 2008 Vortrag X Forms Rapid DevelopmentB1 Lotusday 2008 Vortrag X Forms Rapid Development
B1 Lotusday 2008 Vortrag X Forms Rapid Development
 

Mehr von Ralf Stockmann

Freiräume schaffen - im Social Intranet
Freiräume schaffen - im Social IntranetFreiräume schaffen - im Social Intranet
Freiräume schaffen - im Social Intranet
Ralf Stockmann
 
Die Bibliothek als Wolkenfabrik - Cloud-Dienste als Plattformen für digitale ...
Die Bibliothek als Wolkenfabrik - Cloud-Dienste als Plattformen für digitale ...Die Bibliothek als Wolkenfabrik - Cloud-Dienste als Plattformen für digitale ...
Die Bibliothek als Wolkenfabrik - Cloud-Dienste als Plattformen für digitale ...
Ralf Stockmann
 
Wie man vom Intranet aus die Welt verbessern kann
Wie man vom Intranet aus die Welt verbessern kannWie man vom Intranet aus die Welt verbessern kann
Wie man vom Intranet aus die Welt verbessern kann
Ralf Stockmann
 
Die Revolution vergisst ihre Kinder - Drei Szenarien, wie Bibliotheken in 15 ...
Die Revolution vergisst ihre Kinder - Drei Szenarien, wie Bibliotheken in 15 ...Die Revolution vergisst ihre Kinder - Drei Szenarien, wie Bibliotheken in 15 ...
Die Revolution vergisst ihre Kinder - Drei Szenarien, wie Bibliotheken in 15 ...
Ralf Stockmann
 
Der Zauberlehrling 
war nicht als
 Anleitung gemeint
Der Zauberlehrling 
war nicht als
 Anleitung gemeintDer Zauberlehrling 
war nicht als
 Anleitung gemeint
Der Zauberlehrling 
war nicht als
 Anleitung gemeint
Ralf Stockmann
 
BibliothekarInnen gestalten digitale Wissensräume
BibliothekarInnen gestalten digitale WissensräumeBibliothekarInnen gestalten digitale Wissensräume
BibliothekarInnen gestalten digitale Wissensräume
Ralf Stockmann
 
Was Bibliotheken von der Zukunft lernen können
Was Bibliotheken von der Zukunft lernen könnenWas Bibliotheken von der Zukunft lernen können
Was Bibliotheken von der Zukunft lernen können
Ralf Stockmann
 
Visualisierung bibliographischer Daten
Visualisierung bibliographischer DatenVisualisierung bibliographischer Daten
Visualisierung bibliographischer Daten
Ralf Stockmann
 
DFG Expertenworkshop - Workflow Volltextgenerierung über OCR
DFG Expertenworkshop - Workflow Volltextgenerierung über OCRDFG Expertenworkshop - Workflow Volltextgenerierung über OCR
DFG Expertenworkshop - Workflow Volltextgenerierung über OCR
Ralf Stockmann
 
Das materielle Objekt in der digitalen Welt
Das materielle Objekt in der digitalen WeltDas materielle Objekt in der digitalen Welt
Das materielle Objekt in der digitalen Welt
Ralf Stockmann
 
Die DDB als offene Plattform - Weiterentwicklungen und Anknüpfungspunkte
Die DDB als offene Plattform - Weiterentwicklungen und AnknüpfungspunkteDie DDB als offene Plattform - Weiterentwicklungen und Anknüpfungspunkte
Die DDB als offene Plattform - Weiterentwicklungen und Anknüpfungspunkte
Ralf Stockmann
 
Deutsche Digitale Bibliothek - Vorstellung CeBit 2008
Deutsche Digitale Bibliothek - Vorstellung CeBit 2008Deutsche Digitale Bibliothek - Vorstellung CeBit 2008
Deutsche Digitale Bibliothek - Vorstellung CeBit 2008Ralf Stockmann
 
Central Registry for Digitized Objects: Linking Production and Bibliographic ...
Central Registry for Digitized Objects: Linking Production and Bibliographic ...Central Registry for Digitized Objects: Linking Production and Bibliographic ...
Central Registry for Digitized Objects: Linking Production and Bibliographic ...
Ralf Stockmann
 
Europeana4D - Exploring data in Space and Time (2011)
Europeana4D - Exploring data in Space and Time (2011)Europeana4D - Exploring data in Space and Time (2011)
Europeana4D - Exploring data in Space and Time (2011)
Ralf Stockmann
 
Mets opening day - web based mets creation (2007)
Mets opening day - web based mets creation (2007)Mets opening day - web based mets creation (2007)
Mets opening day - web based mets creation (2007)
Ralf Stockmann
 
eAqua und europeana4D - 2009
eAqua und europeana4D - 2009eAqua und europeana4D - 2009
eAqua und europeana4D - 2009Ralf Stockmann
 
Controlled Vocabularies and Text Mining - Use Cases at the Goettingen
Controlled Vocabularies and Text Mining - Use Cases at the Goettingen Controlled Vocabularies and Text Mining - Use Cases at the Goettingen
Controlled Vocabularies and Text Mining - Use Cases at the Goettingen
Ralf Stockmann
 
Controlled Vocabularies and Text Mining - Use Cases at the Goettingen State a...
Controlled Vocabularies and Text Mining - Use Cases at the Goettingen State a...Controlled Vocabularies and Text Mining - Use Cases at the Goettingen State a...
Controlled Vocabularies and Text Mining - Use Cases at the Goettingen State a...
Ralf Stockmann
 
GUI-Mockups in der Softwareentwicklung
GUI-Mockups in der SoftwareentwicklungGUI-Mockups in der Softwareentwicklung
GUI-Mockups in der Softwareentwicklung
Ralf Stockmann
 
Grundlagen Digitaler Mediengestaltung
Grundlagen Digitaler MediengestaltungGrundlagen Digitaler Mediengestaltung
Grundlagen Digitaler Mediengestaltung
Ralf Stockmann
 

Mehr von Ralf Stockmann (20)

Freiräume schaffen - im Social Intranet
Freiräume schaffen - im Social IntranetFreiräume schaffen - im Social Intranet
Freiräume schaffen - im Social Intranet
 
Die Bibliothek als Wolkenfabrik - Cloud-Dienste als Plattformen für digitale ...
Die Bibliothek als Wolkenfabrik - Cloud-Dienste als Plattformen für digitale ...Die Bibliothek als Wolkenfabrik - Cloud-Dienste als Plattformen für digitale ...
Die Bibliothek als Wolkenfabrik - Cloud-Dienste als Plattformen für digitale ...
 
Wie man vom Intranet aus die Welt verbessern kann
Wie man vom Intranet aus die Welt verbessern kannWie man vom Intranet aus die Welt verbessern kann
Wie man vom Intranet aus die Welt verbessern kann
 
Die Revolution vergisst ihre Kinder - Drei Szenarien, wie Bibliotheken in 15 ...
Die Revolution vergisst ihre Kinder - Drei Szenarien, wie Bibliotheken in 15 ...Die Revolution vergisst ihre Kinder - Drei Szenarien, wie Bibliotheken in 15 ...
Die Revolution vergisst ihre Kinder - Drei Szenarien, wie Bibliotheken in 15 ...
 
Der Zauberlehrling 
war nicht als
 Anleitung gemeint
Der Zauberlehrling 
war nicht als
 Anleitung gemeintDer Zauberlehrling 
war nicht als
 Anleitung gemeint
Der Zauberlehrling 
war nicht als
 Anleitung gemeint
 
BibliothekarInnen gestalten digitale Wissensräume
BibliothekarInnen gestalten digitale WissensräumeBibliothekarInnen gestalten digitale Wissensräume
BibliothekarInnen gestalten digitale Wissensräume
 
Was Bibliotheken von der Zukunft lernen können
Was Bibliotheken von der Zukunft lernen könnenWas Bibliotheken von der Zukunft lernen können
Was Bibliotheken von der Zukunft lernen können
 
Visualisierung bibliographischer Daten
Visualisierung bibliographischer DatenVisualisierung bibliographischer Daten
Visualisierung bibliographischer Daten
 
DFG Expertenworkshop - Workflow Volltextgenerierung über OCR
DFG Expertenworkshop - Workflow Volltextgenerierung über OCRDFG Expertenworkshop - Workflow Volltextgenerierung über OCR
DFG Expertenworkshop - Workflow Volltextgenerierung über OCR
 
Das materielle Objekt in der digitalen Welt
Das materielle Objekt in der digitalen WeltDas materielle Objekt in der digitalen Welt
Das materielle Objekt in der digitalen Welt
 
Die DDB als offene Plattform - Weiterentwicklungen und Anknüpfungspunkte
Die DDB als offene Plattform - Weiterentwicklungen und AnknüpfungspunkteDie DDB als offene Plattform - Weiterentwicklungen und Anknüpfungspunkte
Die DDB als offene Plattform - Weiterentwicklungen und Anknüpfungspunkte
 
Deutsche Digitale Bibliothek - Vorstellung CeBit 2008
Deutsche Digitale Bibliothek - Vorstellung CeBit 2008Deutsche Digitale Bibliothek - Vorstellung CeBit 2008
Deutsche Digitale Bibliothek - Vorstellung CeBit 2008
 
Central Registry for Digitized Objects: Linking Production and Bibliographic ...
Central Registry for Digitized Objects: Linking Production and Bibliographic ...Central Registry for Digitized Objects: Linking Production and Bibliographic ...
Central Registry for Digitized Objects: Linking Production and Bibliographic ...
 
Europeana4D - Exploring data in Space and Time (2011)
Europeana4D - Exploring data in Space and Time (2011)Europeana4D - Exploring data in Space and Time (2011)
Europeana4D - Exploring data in Space and Time (2011)
 
Mets opening day - web based mets creation (2007)
Mets opening day - web based mets creation (2007)Mets opening day - web based mets creation (2007)
Mets opening day - web based mets creation (2007)
 
eAqua und europeana4D - 2009
eAqua und europeana4D - 2009eAqua und europeana4D - 2009
eAqua und europeana4D - 2009
 
Controlled Vocabularies and Text Mining - Use Cases at the Goettingen
Controlled Vocabularies and Text Mining - Use Cases at the Goettingen Controlled Vocabularies and Text Mining - Use Cases at the Goettingen
Controlled Vocabularies and Text Mining - Use Cases at the Goettingen
 
Controlled Vocabularies and Text Mining - Use Cases at the Goettingen State a...
Controlled Vocabularies and Text Mining - Use Cases at the Goettingen State a...Controlled Vocabularies and Text Mining - Use Cases at the Goettingen State a...
Controlled Vocabularies and Text Mining - Use Cases at the Goettingen State a...
 
GUI-Mockups in der Softwareentwicklung
GUI-Mockups in der SoftwareentwicklungGUI-Mockups in der Softwareentwicklung
GUI-Mockups in der Softwareentwicklung
 
Grundlagen Digitaler Mediengestaltung
Grundlagen Digitaler MediengestaltungGrundlagen Digitaler Mediengestaltung
Grundlagen Digitaler Mediengestaltung
 

Ist Langzeitarchivierung finanzierbar? Präsentation Akademie Sankelmark 2008

  • 1. Ist Langzeitarchivierung finanzierbar? Überlegungen zur Produktion langzeitarchivierbarer Objekte Ralf Stockmann, Göttinger Digitalisierungszentrum
  • 2. Langzeitarchivierung – Was kostet es, nichts zu tun? • Dr. Ross King Austrian Research Centers • Kosten für (vergebliche) Produktion, Anzahl relevanter Dokumente, Halbwertzeit von Dokumentenformaten • Für den EU-Raum:
  • 3. Das Göttinger Digitalisierungszentrum (GDZ) • Abteilung der Staats- und Universitätsbibliothek Göttingen (SUB) • Nationales und Internationales Service- und Kompetenzzentrum seit 1997 - zu Beginn gefördert von der Deutschen Forschungsgemeinschaft (DFG) • Entwicklung eines Produktionsworkflows für große Mengen an Digitalisaten im Printbereich • Standardisierungsaktivitäten (METS) • Mehr als 6 Millionen Seiten digitalisiert, über 4 Millionen Seiten online bereitgestellt • Konzeption, Beratung und Durchführung von Projekten (häufig kooperativ) • Zielsetzung: Masse UND Klasse
  • 4. Gliederung • Ebenen der LZA • Komponenten und Kostenfaktoren der LZA • Kostenrechnung • Empfehlungen
  • 5. Ebenen der LZA • Bitstream Preservation (Hardware) – Integrität der Dateien erhalten • Inhalte im Zugriff halten (Software) – Nutzung/Bedeutung der Datei erhalten – Migration – Emulation
  • 6. Komponenten und Kostenfaktoren • Dateiformate • Produktionswerkzeuge • Metadaten • LZA-Management System (für Migration, Emulation) • Storage (4-fach redundant)
  • 7. Produktionworkflow (Digitalisierung) Image Selection PDF Rendering, Upload, Scanning Optimization Quality Control Metadata (Bookshelf) Processing OCR, backup CMS / DMS förderungsfähig Selection Upload Produktion LZA (Bookshelf) CMS / DMS
  • 8. Kostenfaktoren Image PDF Rendering, Upload / Scanning OptimizationPro Quality Control Metadata OCR, backup LZA cessing Dateiformat Header Log PDF/A Format Archivobjekt JPG Software Software ZVDD-METS Ingest TIFF EAD (FAXG4) MuseumDAT Storage JPG2000 3D-Scan LZA: PREMIS Updates Header Migration Hardware Software
  • 9. Kosten entstehen durch… • Weiche Kosten – Change Management Prozesse – Wechsel des Workflow, Schulungen auf neue Tools und Verfahren, … • Harte Kosten – Anschaffungen – Software, Lizenzen – Hardware (Storage, RAID-Systeme)
  • 10. Kosten Software LZA • Produktionssysteme – Open Source (Supportkosten) • Goobi (GDZ) – Kommerziell (Lizenzkosten) • ZENDpro (MDZ) • Semantics • CCS – Ziel: ingestfähige LZA Pakete • LZA Systeme – LOCKSS (open source) – KOPAL (DNB/SUB/IBM) –…
  • 11. Beispielrechnung Storage • Lizenzgebühren LZA Software – 40.000 € p.a. – 100 TB LZA-Storage: 25.000 € einmalig • 4-fach redundant • Tape • 1TB = 250 € – Platz für 62.000 unkomprimierte TIFF Bilder A5 (16 MB pro Seite) – Kosten GDZ Jahresproduktion (3 Mio Seiten): ca. 20.000 € • Kosten pro Seite: ca. 2 Cent • Ca. 10% der Gesamtkosten
  • 12. Dienstleistungs-Infrastruktur • Der Aufbau eigener LZA-Archive ist wenig ratsam • Dienstleister: – GWDG (KOPAL, DNB, SUB) – Leibnitz RZ (BSB) – Angebote noch nicht im Dauerbetrieb getestet
  • 13. Werkzeuge für Format- Validierung JHOVE (JSTOR/Harvard Object Validation Environment) Konformitätsvalidierung für: – AIFF, AIFF-C – ASCII – GIF 87a, 89a – HTML 3.2, 4.0, 4.01, XHTML 1.0, 1.1 – JPEG, JFIF, SPIFF, JTIP, JPEG-LS, Exif 2.0, 2.1, 2.2 – JPEG 2000 JP2, JPX – PDF 1.0 – 1.6, PDF/X-1, -1a, -2, -3, PDF/A, Tagged PDF, Linearized PDF – TIFF 4.0 – 6.0, Class B, G, P, R, Y, F, RFC 1314, TIFF/EP, TIFF/IT (CT, LW, HC, MP, BP, BL, FP, and P1, P2), GeoTIFF, TIFF-FX, Exif 2.0, 2.1, 2.2, DNG – UTF-8 – WAVE, BWF – XML http://hul.harvard.edu/jhove/ http://www.nationalarchives.gov.uk/pronom/
  • 14. Empfehlungen • Vorsicht vor proprietären Formaten • Formate/Metadaten jetzt umstellen, jeder Tag Verzug führt zu höheren Kosten • Bitstream Preservation jetzt garantieren (LOCKS, RAID, Verbund) • LZA Archivsysteme: abwarten bis Marktreif erwiesen und Konsolidierung erreicht • Auf dem Laufenden bleiben: – www.nestor.sub.uni-goettingen.de