Digital Humanities
und die
Österreichische Nationalbibliothek

Max Kaiser
Leiter Forschung & Entwicklung
„Was können und w...
www.slideshare.net/maxkaiser

@maxkaiser
@maxkaiser
Austrian Books
Online

www.onb.ac.at/austrianbooksonline/

Digitalisierung

des gesamten historischen
Buchbestands der
Öst...
600.000
200 Mio

Bände
Seiten
Ende 2013

~185.000 Bände digitalisiert

@maxkaiser
@maxkaiser
Google Books

>20 Mio. Bücher
>
~
~
>

50%
75%
2 Mio.
3 Mio.

@maxkaiser

nicht-Englisch
von Bibliotheken

Bücher von euro...
@maxkaiser
Hathi Trust

>10 Mio. Bände
> 5 Mio. Werke
> 3,5 Mrd. Seiten
> 3 Mio. gemeinfreie Bände
@maxkaiser
@maxkaiser
@maxkaiser
@maxkaiser
@maxkaiser
(Linked) Data
@maxkaiser
@maxkaiser
@maxkaiser
@maxkaiser
@maxkaiser
@maxkaiser
@maxkaiser
Data

@maxkaiser
Kritische Masse
an digital verfügbaren Texten
und (Meta-)Daten

Neue Fragestellungen
an Textmaterial?
@maxkaiser
What Do You
Do with a
Million
Books?

Gregory Crane, 2006
Gregory Crane: What Do You Do with a Million Books?
In: D-Lib Ma...
@maxkaiser
http://data.onb.ac.at/
ABO/%2BZ156239508
@maxkaiser
Ilias / Odyssee: 800 v.Chr.
~1,000.000 Tage seither

@maxkaiser
Suchen
Finden
Lesen
@maxkaiser
@maxkaiser
@maxkaiser
@maxkaiser
@maxkaiser
@maxkaiser
@maxkaiser
52+ Millionen
1+ Milliarde

Seiten

unterschiedliche Terme

@maxkaiser
@maxkaiser
@maxkaiser
@maxkaiser
@maxkaiser
@maxkaiser
Digitale
Inkunabeln?
@maxkaiser
Metadaten

Digitalisierte
Bestände
Metadaten

Digitalisierte
Bestände
Metadaten

DatenDaten
Daten

Tool
Tool

Tool

Tool

Digitalisierte
Bestände

Tool
Tool
Tool

Metadaten

Server
Tool
Server
Server
Tool
Server
Tool Server
Datenverarbeitung

DatenDaten
Daten

Digitalisierte
Bes...
@maxkaiser
ÖNB Hadoop-Cluster
→Durchführen von Workflows verschiedener
Tools auf Gesamtdatenbestand
→Abfragen über Gesamtbestand der ...
Tool

Metadaten

Server
Tool
Server
Server
Tool
Server
Tool Server
Datenverarbeitung

DatenDaten
Daten

Digitalisierte
Bes...
Close Reading

Interpretation / Analyse /
Edition individueller Texte /
überschaubarer Korpora

Distant Reading

Analyse v...
@maxkaiser
of the Early Arab Period Online
@maxkaiser
→ Papyrussammlung der Österreichischen
Nationalbibliothek
→ Gefördert durch Andrew Mellon Foundation,
2013–2015
→ Folgepro...
Briefwechsel
August Sauer
Bernhard Seuffert
@maxkaiser
→
→
→
→

→
→
→
→

Literaturarchiv der Österreichischen Nationalbibliothek
Finanzierung: FWF / DFG
Kommentierte Auswahl von...
@maxkaiser
BRIEFWECHSEL (Wege durch den Briefwechsel – Werkregister –
Einzeltrefferanzeige/unvollständig = keine Manifestation ausgew...
Digitised
Manuscripts
to Europeana
@maxkaiser
→ Abteilung für Forschung und Entwicklung der
Österreichischen Nationalbibliothek
→ EU-Projekt (CIP-ICT-PSP-2011)
→ 11 Pro...
@maxkaiser
@maxkaiser
→http://www.thepund.it/visualization-demos/philosophers-demo-howto/

@maxkaiser
online

Handke
@maxkaiser
→ Literaturarchiv der Österreichischen
Nationalbibliothek
→ FWF-Projekt seit Mai 2011
→ Schneller und umkomplizierter Zuga...
@maxkaiser
@maxkaiser
@maxkaiser
Netzbiographie

Ernst Jandl
@maxkaiser
→
→
→
→

Projekt mit Ludwig Boltzmann Institut für Geschichte und
Theorie der Biographie
Literaturarchiv der Österreichisc...
@maxkaiser
Close Reading

Interpretation / Analyse /
Edition individueller Texte /
überschaubarer Korpora

Distant Reading

Analyse v...
@maxkaiser
Franco Moretti, Stanford
@maxkaiser

http://www.theguardian.com/books/2006/jan
/09/highereducation.academicexperts
@maxkaiser
Historische Verortung individueller Texte /
Autoren / Genres Entwicklung der literarischen
Produktion: Zeitspannen / Regio...
Data

@maxkaiser
Größenordnung
Bislang bearbeitet:

170.078 Bücher
54.207.892 Seiten
18.827.510.019 Token

@maxkaiser

Austrian Books
Online
Heterogenität

@maxkaiser
Jahrhunderte …

Austrian Books
Online

2%
10%
16. Jh.

14%
43%

17. Jh.
18. Jh.
19. Jh.
no year

31%
@maxkaiser
Sprachen …

Austrian Books
Online

3%
8%

13%
eng

14%

31%

ita
fre
lat
ger

31%
@maxkaiser

others
70%

Austrian Books
Online

60%

50%

eng

40%

ita
fre
30%

lat
ger

20%

10%

0%
16. Jh.
@maxkaiser

17. Jh.

18. Jh.

1...
@maxkaiser
@maxkaiser
@maxkaiser
@maxkaiser
OCR: Latein

@maxkaiser
OCR: Ungarisch

@maxkaiser
@maxkaiser
@maxkaiser
@maxkaiser
Bibliotheken
@maxkaiser
@maxkaiser
@maxkaiser
Tool

Metadaten

Server
Tool
Server
Server
Tool
Server
Tool Server
Datenverarbeitung

DatenDaten
Daten

Digitalisierte
Bes...
Fachexpertise

DatenmanagementExpertise

SoftwareentwicklungsExpertise
ProjektmanagementExpertise
@maxkaiser

Datenanalyse...
“The idea behind the Digging into Data Challenge
is to answer the question "what do you do with a
million books?" Or a mil...
@maxkaiser
Digging into Image Data to Answer Authorship
Related Questions Digging into the
Enlightenment: Mapping the Republic of Let...
@maxkaiser
@maxkaiser
@maxkaiser
British Library

@maxkaiser
Every book tells
a story, but
what can
68,000 books
tell you?

Aly Conteh, British Library
@maxkaiser

http://impactocr.wo...
@maxkaiser
68.000 digitalisierte Bücher 19. Jh.
Britische Nationalbibliographie als
Linked Open Data Daten des UK
Web Archive etc.

@...
Digitale Bestände Labs-Umgebung
Analyse der digitalen Sammlungen
Entwicklung von Tools & Services
Workshops & Wettbewerbe ...
Lab Hack
Days

@maxkaiser
Korpusanalyse-Tools
Visualisierungen Topic Models
Ortsbasierte Suche Geotagging
Annotationen APIs für Datenbestände Crowds...
→ EU-Projekt (ICT PSP-Programm), 2013-2015
→ www.europeanacreative.eu
→ Koordiniert durch Österreichische
Nationalbiblioth...
Vision 2025
der Österreichischen

Nationalbibliothek
@maxkaiser
September 2012
http://www.onb.ac.at/
vision2025

@maxkaiser
→

@maxkaiser
@maxkaiser
Revolution in Produktion,
Speicherung und
Verbreitung von Wissen

@maxkaiser
Vision 2025
Wissen für die Welt von morgen

Unsere Bestände sind digitalisiert

Wir sammeln und sichern Wissen in jeder Fo...
2025

„durch uns ist
F
orschung vielfältiger
und effektiver“

→ Einbindung von digitalen Inhalten und Services
in Forschun...
Let‘s talk!
@maxkaiser
Danke!
max.kaiser@onb.ac.at
www.onb.ac.at
www.linkedin.com/in/maxkaiser
twitter.com/maxkaiser
@maxkaiser
Digital Humanities und die Österreichische Nationalbibliothek
Digital Humanities und die Österreichische Nationalbibliothek
Digital Humanities und die Österreichische Nationalbibliothek
Digital Humanities und die Österreichische Nationalbibliothek
Digital Humanities und die Österreichische Nationalbibliothek
Digital Humanities und die Österreichische Nationalbibliothek
Digital Humanities und die Österreichische Nationalbibliothek
Digital Humanities und die Österreichische Nationalbibliothek
Digital Humanities und die Österreichische Nationalbibliothek
Digital Humanities und die Österreichische Nationalbibliothek
Nächste SlideShare
Wird geladen in …5
×

Digital Humanities und die Österreichische Nationalbibliothek

2.912 Aufrufe

Veröffentlicht am

Presentation at "Was können und wollen die Digital Humanities" conference, Vienna, 25 October 2013

Veröffentlicht in: Technologie
0 Kommentare
0 Gefällt mir
Statistik
Notizen
  • Als Erste(r) kommentieren

  • Gehören Sie zu den Ersten, denen das gefällt!

Keine Downloads
Aufrufe
Aufrufe insgesamt
2.912
Auf SlideShare
0
Aus Einbettungen
0
Anzahl an Einbettungen
335
Aktionen
Geteilt
0
Downloads
5
Kommentare
0
Gefällt mir
0
Einbettungen 0
Keine Einbettungen

Keine Notizen für die Folie

Digital Humanities und die Österreichische Nationalbibliothek

  1. 1. Digital Humanities und die Österreichische Nationalbibliothek Max Kaiser Leiter Forschung & Entwicklung „Was können und wollen die Digital Humanities“ 25. 10.2013 Österreichische Nationalbibliothek @maxkaiser
  2. 2. www.slideshare.net/maxkaiser @maxkaiser
  3. 3. @maxkaiser
  4. 4. Austrian Books Online www.onb.ac.at/austrianbooksonline/ Digitalisierung des gesamten historischen Buchbestands der Österreichischen Nationalbibliothek @maxkaiser
  5. 5. 600.000 200 Mio Bände Seiten
  6. 6. Ende 2013 ~185.000 Bände digitalisiert @maxkaiser
  7. 7. @maxkaiser
  8. 8. Google Books >20 Mio. Bücher > ~ ~ > 50% 75% 2 Mio. 3 Mio. @maxkaiser nicht-Englisch von Bibliotheken Bücher von europäischen Bibliotheken gemeinfreie Bücher
  9. 9. @maxkaiser
  10. 10. Hathi Trust >10 Mio. Bände > 5 Mio. Werke > 3,5 Mrd. Seiten > 3 Mio. gemeinfreie Bände @maxkaiser
  11. 11. @maxkaiser
  12. 12. @maxkaiser
  13. 13. @maxkaiser
  14. 14. @maxkaiser
  15. 15. (Linked) Data @maxkaiser
  16. 16. @maxkaiser
  17. 17. @maxkaiser
  18. 18. @maxkaiser
  19. 19. @maxkaiser
  20. 20. @maxkaiser
  21. 21. @maxkaiser
  22. 22. Data @maxkaiser
  23. 23. Kritische Masse an digital verfügbaren Texten und (Meta-)Daten Neue Fragestellungen an Textmaterial? @maxkaiser
  24. 24. What Do You Do with a Million Books? Gregory Crane, 2006 Gregory Crane: What Do You Do with a Million Books? In: D-Lib Magazine, March 2006, http://www.dlib.org/dlib/march06/crane/03crane.html @maxkaiser http://impactocr.wordpress.com/2011/10/25/keynoteocr-and-the-transformation-of-the-humanities-2/
  25. 25. @maxkaiser
  26. 26. http://data.onb.ac.at/ ABO/%2BZ156239508
  27. 27. @maxkaiser
  28. 28. Ilias / Odyssee: 800 v.Chr. ~1,000.000 Tage seither @maxkaiser
  29. 29. Suchen Finden Lesen @maxkaiser
  30. 30. @maxkaiser
  31. 31. @maxkaiser
  32. 32. @maxkaiser
  33. 33. @maxkaiser
  34. 34. @maxkaiser
  35. 35. @maxkaiser
  36. 36. 52+ Millionen 1+ Milliarde Seiten unterschiedliche Terme @maxkaiser
  37. 37. @maxkaiser
  38. 38. @maxkaiser
  39. 39. @maxkaiser
  40. 40. @maxkaiser
  41. 41. @maxkaiser
  42. 42. Digitale Inkunabeln? @maxkaiser
  43. 43. Metadaten Digitalisierte Bestände
  44. 44. Metadaten Digitalisierte Bestände
  45. 45. Metadaten DatenDaten Daten Tool Tool Tool Tool Digitalisierte Bestände Tool Tool
  46. 46. Tool Metadaten Server Tool Server Server Tool Server Tool Server Datenverarbeitung DatenDaten Daten Digitalisierte Bestände
  47. 47. @maxkaiser
  48. 48. ÖNB Hadoop-Cluster →Durchführen von Workflows verschiedener Tools auf Gesamtdatenbestand →Abfragen über Gesamtbestand der Daten von Austrian Books Online →Skalierbare Datenverarbeitung großer Datenmengen →„Datenverarbeitung zu den Daten bringen“
  49. 49. Tool Metadaten Server Tool Server Server Tool Server Tool Server Datenverarbeitung DatenDaten Daten Digitalisierte Bestände
  50. 50. Close Reading Interpretation / Analyse / Edition individueller Texte / überschaubarer Korpora Distant Reading Analyse von Big Data Textmining @maxkaiser
  51. 51. @maxkaiser
  52. 52. of the Early Arab Period Online @maxkaiser
  53. 53. → Papyrussammlung der Österreichischen Nationalbibliothek → Gefördert durch Andrew Mellon Foundation, 2013–2015 → Folgeprojekt 2015 ff → Weltweit umfangreichste Sammlung von arabischen Dokumenten aus Spätantike und Frühmittelalter → Digitalisierung: zunächst 4.000 Schriftstücke → Katalogisierung →Online-Edition @maxkaiser
  54. 54. Briefwechsel August Sauer Bernhard Seuffert @maxkaiser
  55. 55. → → → → → → → → Literaturarchiv der Österreichischen Nationalbibliothek Finanzierung: FWF / DFG Kommentierte Auswahl von ca. 350 Briefen in Druckform Digitale Präsentation der Gesamtkorrespondenz → Faksimiles und Transkription → TEI-Kodierung der Metadaten Auszeichnung von Personen und zitierter Fachliteratur in 350 Briefen nach FRBR-Richtlinien Darstellung von Wissensnetzwerken im Netz Userzentrierte, flexible Organisation von Inhalten → Brieftexte, Personen, Werke Nutzung der Codierung für Darstellung und Durchsuchbarkeit @maxkaiser
  56. 56. @maxkaiser
  57. 57. BRIEFWECHSEL (Wege durch den Briefwechsel – Werkregister – Einzeltrefferanzeige/unvollständig = keine Manifestation ausgewählt): ÖNB-Logo Briefwechsel August Sauer – Bernhard Seuffert Impressum I Kontakt I Back ÖNB /LIT Suche (Volltext) ........... Suche (strukturiert) Home August Sauer Bernhard Seuffert Briefwechsel Zeitleiste Bibliographie Forschungsbeiträge Vorwort Editionsprinzipien Wege durch den Briefwechsel Namensregister Werkregister Ranftl, Johann: Ludwig Tiecks Genoveva als romantische Dichtung Im Briefwechsel Werk vernetzt Realisierungen ÖNB-Katalog etc. Digitalisat XML-Ansicht weitere Werke Vernetzung des Werks schematisch / als Liste ! Autor ABCDEFG HIJKLMN OPQRSTU VWXYZ Suche Ortsregister Themengebiete Briefe strukturiert durchsuchen Briefe – chronologisch Anstelle von stilisierten Personen stilisierte Bücher verwenden. Beim Klicken auf das entsprechende Kästchen kommt man per Hyperlink auf die Seite „Einzeltreffer/unvollständig“ ! also entweder auf „vernetzte“ Einträge oder – falls in diesem
  58. 58. Digitised Manuscripts to Europeana @maxkaiser
  59. 59. → Abteilung für Forschung und Entwicklung der Österreichischen Nationalbibliothek → EU-Projekt (CIP-ICT-PSP-2011) → 11 Projektpartner und 11 assoziierte Partner → Aggregation von Metadaten zu digitalisierten Manuskripten via Europeana → Harmonisierung der verschiedenen Quellmetadaten in ein für Manuskripte optimiertem Format → DM2E Data Model (Spezialisierung des Europeana Data Model EDM) → Tool für semantische Annotation und quantitative Analyse der erstellten Annotationen: Pundit @maxkaiser
  60. 60. @maxkaiser
  61. 61. @maxkaiser
  62. 62. →http://www.thepund.it/visualization-demos/philosophers-demo-howto/ @maxkaiser
  63. 63. online Handke @maxkaiser
  64. 64. → Literaturarchiv der Österreichischen Nationalbibliothek → FWF-Projekt seit Mai 2011 → Schneller und umkomplizierter Zugang zu den Werkmaterialien zu Peter Handke → Einblicke in Produktionsweise des Autors → Wege durchs Material → Notizbücher 1972 bis 1990 → Auflistung in chronologischer Reihenfolge → Beispielfaksimiles → Werke und Materialien zu Veröffentlichungen → Forschungsbeiträge → Bibliographie @maxkaiser
  65. 65. @maxkaiser
  66. 66. @maxkaiser
  67. 67. @maxkaiser
  68. 68. Netzbiographie Ernst Jandl @maxkaiser
  69. 69. → → → → Projekt mit Ludwig Boltzmann Institut für Geschichte und Theorie der Biographie Literaturarchiv der Österreichischen Nationalbibliothek Voraussetzung: Erschließung des umfangreichen Nachlasse Ernst Jandls Virtuelle Biographie → → → → → → Vernetzte Darstellung der Biographie Kontextualisierung im Literaturbetrieb Offene und modulare Plattform Dynamisch anstelle linearen Erzählens Weiterentwicklung der virtuellen Biographie mit neuen wissenschaftlichen Erkenntnissen Interaktion mit Usern @maxkaiser
  70. 70. @maxkaiser
  71. 71. Close Reading Interpretation / Analyse / Edition individueller Texte / überschaubarer Korpora Distant Reading Analyse von Big Data Textmining @maxkaiser
  72. 72. @maxkaiser
  73. 73. Franco Moretti, Stanford @maxkaiser http://www.theguardian.com/books/2006/jan /09/highereducation.academicexperts
  74. 74. @maxkaiser
  75. 75. Historische Verortung individueller Texte / Autoren / Genres Entwicklung der literarischen Produktion: Zeitspannen / Regionen / demographischen Gruppen Entwicklung literarischer Muster und Lexika Literarisches Feld: kulturelle / soziologische Einflüsse, die literarische Kultur aus individuellen Autoren, Texte und Genres ausmachen Entwicklung von literarischen Themen / Moden über die Zeit Geschmack des literarischen Establishments im Vergleich zum allgemeinen Geschmack Literarische Trends in Korrelation zu historischen Ereignissen Literarische Schulen und Traditionen Kanonische vs. marginalisierte Autoren Matthew L. Jockers: Macroanalysis, 2013 @maxkaiser
  76. 76. Data @maxkaiser
  77. 77. Größenordnung
  78. 78. Bislang bearbeitet: 170.078 Bücher 54.207.892 Seiten 18.827.510.019 Token @maxkaiser Austrian Books Online
  79. 79. Heterogenität @maxkaiser
  80. 80. Jahrhunderte … Austrian Books Online 2% 10% 16. Jh. 14% 43% 17. Jh. 18. Jh. 19. Jh. no year 31% @maxkaiser
  81. 81. Sprachen … Austrian Books Online 3% 8% 13% eng 14% 31% ita fre lat ger 31% @maxkaiser others
  82. 82. 70% Austrian Books Online 60% 50% eng 40% ita fre 30% lat ger 20% 10% 0% 16. Jh. @maxkaiser 17. Jh. 18. Jh. 19. Jh.
  83. 83. @maxkaiser
  84. 84. @maxkaiser
  85. 85. @maxkaiser
  86. 86. @maxkaiser
  87. 87. OCR: Latein @maxkaiser
  88. 88. OCR: Ungarisch @maxkaiser
  89. 89. @maxkaiser
  90. 90. @maxkaiser
  91. 91. @maxkaiser
  92. 92. Bibliotheken @maxkaiser
  93. 93. @maxkaiser
  94. 94. @maxkaiser
  95. 95. Tool Metadaten Server Tool Server Server Tool Server Tool Server Datenverarbeitung DatenDaten Daten Digitalisierte Bestände @maxkaiser
  96. 96. Fachexpertise DatenmanagementExpertise SoftwareentwicklungsExpertise ProjektmanagementExpertise @maxkaiser DatenanalyseExpertise
  97. 97. “The idea behind the Digging into Data Challenge is to answer the question "what do you do with a million books?" Or a million pages of newspaper? Or a million photographs of artwork? That is, how does the notion of scale affect humanities and social science research? Now that scholars have access to huge repositories of digitized data -- far more than they could read in a lifetime -- what does that mean for research?” http://www.diggingintodata.org @maxkaiser
  98. 98. @maxkaiser
  99. 99. Digging into Image Data to Answer Authorship Related Questions Digging into the Enlightenment: Mapping the Republic of Letters Mining a Year of Speech Structural Analysis of Large Amounts of Musical Information Harvesting Speech Datasets for Linguistic Research on the Web Using Zotero and TAPOR on the Old Bailey Proceedings: Data Mining with Criminal Intent Towards Dynamic Variorum Editions Railroads and the making of Modern America--Tools for Spatio-Temporal Correlation, Analysis and Visualization @maxkaiser
  100. 100. @maxkaiser
  101. 101. @maxkaiser
  102. 102. @maxkaiser
  103. 103. British Library @maxkaiser
  104. 104. Every book tells a story, but what can 68,000 books tell you? Aly Conteh, British Library @maxkaiser http://impactocr.wordpress.com/2 011/07/11/impact-demo-day-atbritish-library/
  105. 105. @maxkaiser
  106. 106. 68.000 digitalisierte Bücher 19. Jh. Britische Nationalbibliographie als Linked Open Data Daten des UK Web Archive etc. @maxkaiser
  107. 107. Digitale Bestände Labs-Umgebung Analyse der digitalen Sammlungen Entwicklung von Tools & Services Workshops & Wettbewerbe Kontakt zu MitarbeiterInnen Beste Ideen “Researcher in Residence” @maxkaiser
  108. 108. Lab Hack Days @maxkaiser
  109. 109. Korpusanalyse-Tools Visualisierungen Topic Models Ortsbasierte Suche Geotagging Annotationen APIs für Datenbestände Crowdsourcing Natural Language Processing Transkription @maxkaiser
  110. 110. → EU-Projekt (ICT PSP-Programm), 2013-2015 → www.europeanacreative.eu → Koordiniert durch Österreichische Nationalbibliothek, 26 Partner → Entwicklung der Europeana Labs →Zugang zu Kulturinhalten zur Weiternutzung →APIs und Services
  111. 111. Vision 2025 der Österreichischen Nationalbibliothek @maxkaiser
  112. 112. September 2012 http://www.onb.ac.at/ vision2025 @maxkaiser
  113. 113. → @maxkaiser @maxkaiser
  114. 114. Revolution in Produktion, Speicherung und Verbreitung von Wissen @maxkaiser
  115. 115. Vision 2025 Wissen für die Welt von morgen Unsere Bestände sind digitalisiert Wir sammeln und sichern Wissen in jeder Form Der Zugang zu unserem Wissen ist einfacher Durch uns ist Forschung vielfältiger und effektiver Wir bereichern das kulturelle und gesellschaftliche Leben @maxkaiser
  116. 116. 2025 „durch uns ist F orschung vielfältiger und effektiver“ → Einbindung von digitalen Inhalten und Services in Forschungsinfrastrukturen → Digital Humanities-Projekte → Offene Schnittstellen → Digitale Editionsprojekte → Enge Zusammenarbeit mit ForscherInnen @maxkaiser
  117. 117. Let‘s talk! @maxkaiser
  118. 118. Danke! max.kaiser@onb.ac.at www.onb.ac.at www.linkedin.com/in/maxkaiser twitter.com/maxkaiser @maxkaiser

×