Historische Zeitungen Online– Schritt für Schritt             Christa Müller             Österreichische Nationalbibliothek
ANNO – AustriaNNewspapers Online• http://anno.onb.ac.at/• historische österreichische Zeitungen und  Zeitschriften• seit M...
Warum Zeitungen?• internationale, regionale und lokale  Geschichte, Politik, Kultur und  Gesellschaftsfragen• unmittelbare...
Massendigitalisierung: ANNO• Dienstleister scannt – EU-weite  Ausschreibung• nicht vom MF, immer vom Original• Auflicht un...
Besonderheiten derZeitungen• vertraute Textsorte• nur sehr wenige Exemplare erhalten• „Verbrauchsgut“
Verbesserungen für dieLeser: Schritt für Schritt1.       Imageversion:     •     Titelliste     •     Jahreseinstieg
Verbesserte Nutzung vonZeitschriften• Inhaltsverzei  chnisse  erschließen
ANNO – OCR-Pilot
ANNO in TelPlus
BesondereHerausforderungen für OCR• Zeitungen weniger sorgfältig gedruckt als  Bücher: Druckerschwärze ungleichmäßig,  dün...
ABO – Austrian Books Online• Public-Private-Partnership• historischen Buchbestand vom 16. bis  zum 19. Jahrhundert• 600.00...
Texterkennung• Volltextsuche in Zeitungen getrennt von  Büchern• Suchworte mit Tagesdatumsangaben  kombinieren• OCR von Ze...
Was nun?• Leser findet immer etwas – was?• Was findet er nicht?• möglicher erster Lösungsansatz: Index  offenlegen  –   po...
Danke!• anno.onb.ac.at
Digitalisierungspraxis - Müller - Zeitungsvolltexte
Digitalisierungspraxis - Müller - Zeitungsvolltexte
Digitalisierungspraxis - Müller - Zeitungsvolltexte
Digitalisierungspraxis - Müller - Zeitungsvolltexte
Digitalisierungspraxis - Müller - Zeitungsvolltexte
Digitalisierungspraxis - Müller - Zeitungsvolltexte
Digitalisierungspraxis - Müller - Zeitungsvolltexte
Digitalisierungspraxis - Müller - Zeitungsvolltexte
Digitalisierungspraxis - Müller - Zeitungsvolltexte
Digitalisierungspraxis - Müller - Zeitungsvolltexte
Digitalisierungspraxis - Müller - Zeitungsvolltexte
Digitalisierungspraxis - Müller - Zeitungsvolltexte
Digitalisierungspraxis - Müller - Zeitungsvolltexte
Nächste SlideShare
Wird geladen in …5
×

Digitalisierungspraxis - Müller - Zeitungsvolltexte

1.807 Aufrufe

Veröffentlicht am

0 Kommentare
0 Gefällt mir
Statistik
Notizen
  • Als Erste(r) kommentieren

  • Gehören Sie zu den Ersten, denen das gefällt!

Keine Downloads
Aufrufe
Aufrufe insgesamt
1.807
Auf SlideShare
0
Aus Einbettungen
0
Anzahl an Einbettungen
881
Aktionen
Geteilt
0
Downloads
4
Kommentare
0
Gefällt mir
0
Einbettungen 0
Keine Einbettungen

Keine Notizen für die Folie

Digitalisierungspraxis - Müller - Zeitungsvolltexte

  1. 1. Historische Zeitungen Online– Schritt für Schritt Christa Müller Österreichische Nationalbibliothek
  2. 2. ANNO – AustriaNNewspapers Online• http://anno.onb.ac.at/• historische österreichische Zeitungen und Zeitschriften• seit Mai 2003• 6,5 Mio gescannte Zeitungsseiten online• ca. 190 Zeitungs- und Zeitschriftentiteln• frei und kostenlos• täglich > 1500 Leser
  3. 3. Warum Zeitungen?• internationale, regionale und lokale Geschichte, Politik, Kultur und Gesellschaftsfragen• unmittelbarer Spiegel des Tagesgeschehens• Verbesserung der Zugänglichkeit (Probleme für Leser)• Integrierte Sammlungen• Schonung der Originale• Zusatznutzen
  4. 4. Massendigitalisierung: ANNO• Dienstleister scannt – EU-weite Ausschreibung• nicht vom MF, immer vom Original• Auflicht und Durchlauf• pro Jahr ca. 1 Mio Seiten
  5. 5. Besonderheiten derZeitungen• vertraute Textsorte• nur sehr wenige Exemplare erhalten• „Verbrauchsgut“
  6. 6. Verbesserungen für dieLeser: Schritt für Schritt1. Imageversion: • Titelliste • Jahreseinstieg
  7. 7. Verbesserte Nutzung vonZeitschriften• Inhaltsverzei chnisse erschließen
  8. 8. ANNO – OCR-Pilot
  9. 9. ANNO in TelPlus
  10. 10. BesondereHerausforderungen für OCR• Zeitungen weniger sorgfältig gedruckt als Bücher: Druckerschwärze ungleichmäßig, dünnes Papier• großes Format• viele Eigennamen (Orte und Personen)• mehrere Spalten• kleine Schrift
  11. 11. ABO – Austrian Books Online• Public-Private-Partnership• historischen Buchbestand vom 16. bis zum 19. Jahrhundert• 600.000 urheberrechtsfreie Werke• 180 Millionen Seiten
  12. 12. Texterkennung• Volltextsuche in Zeitungen getrennt von Büchern• Suchworte mit Tagesdatumsangaben kombinieren• OCR von Zeitungen nicht so gut wie von Büchern
  13. 13. Was nun?• Leser findet immer etwas – was?• Was findet er nicht?• möglicher erster Lösungsansatz: Index offenlegen – positionierbar – Filter – Fuzzy Logik – durchsuchbar – …… ????
  14. 14. Danke!• anno.onb.ac.at

×