Diese Präsentation wurde erfolgreich gemeldet.
Wir verwenden Ihre LinkedIn Profilangaben und Informationen zu Ihren Aktivitäten, um Anzeigen zu personalisieren und Ihnen relevantere Inhalte anzuzeigen. Sie können Ihre Anzeigeneinstellungen jederzeit ändern.
Die SBB in Europa:
Europeana 1914-1918,
Europeana Newspapers
& mehr
Clemens Neudecker
Staatsbibliothek zu Berlin
Berliner ...
Europeana
• Die europäische Plattform für das digitalisierte
kulturelle Erbe aus Bibliotheken, Museen, Archiven
• Aktuell ...
Europeana Collections 1914-1918
• Förderlinie CIP-ICT-PSP (€5.4 Mio. , €2.7 Mio. EU)
• Laufzeit: Mai 2011 – April 2014
• 1...
Europeana Collections 1914-1918
• Hauptziele
– Digitalisierung von 400.000 Objekten zu WW1
unter Gesichtspunkten wie:
• Ho...
Europeana Collections 1914-1918
• Ergebnisse
– 425.000 digitalisierte Objekte, darunter:
• mehr als 10.000 Bücher
• etwa 1...
Gemeinsames Themenportal:
www.europeana1914-1918.eu
Deutsch
Englisch
Italienisch
Französisch
Niederländisch
Dänisch
Serbisch
Europeana Newspapers
• Förderlinie CIP-ICT-PSP (€5.2 Mio. , €4.1 Mio. EU)
• Laufzeit: Februar 2012 – März 2015
• 18 Projek...
Europeana Newspapers
• Hauptziele
– Aggregation und Transformation zu EDM von
Metadaten digitalisierter Zeitungen in Europ...
Europeana Newspapers
• Ergebnisse
– Größter Dateningest seit Bestehen der Europeana:
3.6 Mio. Records, >10 TB Daten
– 10 M...
82.4%
85.3%
80.9%
75.9%
67.5%
83.4% 84.1%
68.1%
93.1%
57.6%
87.0%
68.3%
76.1%
82.6%
54.1%
32.7%
0%
10%
20%
30%
40%
50%
60%...
http://www.theeuropeanlibrary.org/tel4/newspapers
http://europeananewspapers.github.io
Europeana DSI
• Seit 2015: Finanzierung der Europeana durch
die EU-Kommission als „Digital Service
Infrastructure“ im Rahm...
SBB Daten in Europeana: Nutzung
• Brandneu seit 6. April 2016!
• Aktuell:
– 142,612 digitale Objekte der SBB in Europeana
...
Danke für Ihre Aufmerksamkeit!
Noch Fragen?
Clemens Neudecker
Staatsbibliothek zu Berlin
Berliner DH-Rundgang
16. April 20...
Berliner DH Rundgang
Berliner DH Rundgang
Berliner DH Rundgang
Berliner DH Rundgang
Nächste SlideShare
Wird geladen in …5
×

Berliner DH Rundgang

147 Aufrufe

Veröffentlicht am

17. Berliner Digital Humanities Rundgang @ Staatsbibliothek zu Berlin. Europeana, Europeana Newspapers, Europeana 1914-1918

Veröffentlicht in: Technologie
  • Als Erste(r) kommentieren

  • Gehören Sie zu den Ersten, denen das gefällt!

Berliner DH Rundgang

  1. 1. Die SBB in Europa: Europeana 1914-1918, Europeana Newspapers & mehr Clemens Neudecker Staatsbibliothek zu Berlin Berliner DH-Rundgang 16. April 2016 @cneudecker
  2. 2. Europeana • Die europäische Plattform für das digitalisierte kulturelle Erbe aus Bibliotheken, Museen, Archiven • Aktuell über 52 Mio. digitale Objekte • 2016: Relaunch als „Europeana Collections“ mit thematischen Schwerpunkten • www.europeana.eu/portal/
  3. 3. Europeana Collections 1914-1918 • Förderlinie CIP-ICT-PSP (€5.4 Mio. , €2.7 Mio. EU) • Laufzeit: Mai 2011 – April 2014 • 12 Projektpartner • 4 Arbeitspakete • Koordiniert durch Staatsbibliothek zu Berlin • www.europeana-collections-1914-1918.eu
  4. 4. Europeana Collections 1914-1918 • Hauptziele – Digitalisierung von 400.000 Objekten zu WW1 unter Gesichtspunkten wie: • Hohe Qualität der Digitalisierung • Auswahl der Objekte in Kooperation mit Experten und Vertretern relevanter Zielgruppen • Abdeckung einer großen Vielfalt von Materialien • Seltene und fragile Bestände • Zusätzliche Erschließung (z.B. Themengruppen)
  5. 5. Europeana Collections 1914-1918 • Ergebnisse – 425.000 digitalisierte Objekte, darunter: • mehr als 10.000 Bücher • etwa 1.700 Liedertexte und Notenbücher • etwa 100.000 Zeitschriften und Zeitungen • 150.000 handschriftliche Objekte (Tagebücher, Briefe) • 180.00 Plakate, Fotos und Postkarten – Mehrsprachiges, thematisch geordnetes Portal – Virtuelle und physische Ausstellungen – „Unlocking Sources“ Konferenz
  6. 6. Gemeinsames Themenportal: www.europeana1914-1918.eu
  7. 7. Deutsch Englisch Italienisch Französisch Niederländisch Dänisch Serbisch
  8. 8. Europeana Newspapers • Förderlinie CIP-ICT-PSP (€5.2 Mio. , €4.1 Mio. EU) • Laufzeit: Februar 2012 – März 2015 • 18 Projektpartner + 11 assoziierte Partner • 6 Arbeitspakete • Koordiniert durch Staatsbibliothek zu Berlin • www.europeana-newspapers.eu
  9. 9. Europeana Newspapers • Hauptziele – Aggregation und Transformation zu EDM von Metadaten digitalisierter Zeitungen in Europa – OCR/OLR für 10 Mio. Zeitungsseiten – Entwicklung eines Webportals für Volltextsuche – Design eines Meta- und Strukturdatenmodell – Methoden und Werkzeuge für die Evaluation – Workshops und Best-Practice Empfehlungen
  10. 10. Europeana Newspapers • Ergebnisse – Größter Dateningest seit Bestehen der Europeana: 3.6 Mio. Records, >10 TB Daten – 10 Mio. Seiten OCR + 2 Mio. Seiten OLR – Content-browser basierend auf JP2, IIP, IIIF – ENMAP (METS/ALTO) Datenmodell – Open Source Software Werkzeuge – 3 Datensets zur freien Nachnutzung: Ground truth, Named entities, Text mining
  11. 11. 82.4% 85.3% 80.9% 75.9% 67.5% 83.4% 84.1% 68.1% 93.1% 57.6% 87.0% 68.3% 76.1% 82.6% 54.1% 32.7% 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% SuccessRate Language Setting Bag of Words OCR Evaluation Per Language 67.3% 81.4% 64.0% 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% Gothic Normal Mixed SuccessRate Font Bag of Words OCR Evaluation Per Font 79.1% 62.2% 55.9% 58.8% 94.7% 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% Keyword search Phrase search Access via content structure Print/ebook on demand Content based image retrieval SuccessRate(harmonic,areabased) Evaluation Profile Layout Analysis Performance Per evaluationprofile 74.35% 75.31% 70% 71% 72% 73% 74% 75% 76% 77% NCSR Binarisation Original Image SuccessRate Image Source Bag of Words OCR Evaluation Binarised image vs. original image 75.3% 53.78% 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% SuccessRate(countbased) OCR Engine Bag of Words OCR Evaluation FineReader vs. Tesseract FineReader Tesseract
  12. 12. http://www.theeuropeanlibrary.org/tel4/newspapers
  13. 13. http://europeananewspapers.github.io
  14. 14. Europeana DSI • Seit 2015: Finanzierung der Europeana durch die EU-Kommission als „Digital Service Infrastructure“ im Rahmen des CEF Programm • SBB ist Projektpartner in Europeana DSI-2 und dort zuständig für die Weiterentwicklung und den Launch einer „Europeana Newspapers Collection“ (voraussichtlich Q1/2017)
  15. 15. SBB Daten in Europeana: Nutzung • Brandneu seit 6. April 2016! • Aktuell: – 142,612 digitale Objekte der SBB in Europeana – 99,2% „available for re-use“ (CC-BY-SA, CC-0) • Europeana Statistics Dashboard SBB-PK
  16. 16. Danke für Ihre Aufmerksamkeit! Noch Fragen? Clemens Neudecker Staatsbibliothek zu Berlin Berliner DH-Rundgang 16. April 2016 @cneudecker

×