SlideShare ist ein Scribd-Unternehmen logo
1 von 41
Downloaden Sie, um offline zu lesen
1
Texte visualisieren und lesenTexte visualisieren und lesen
Über linguistische Lektüren im digitalenÜber linguistische Lektüren im digitalen
Zeitalter und die Rolle der BibliothekenZeitalter und die Rolle der Bibliotheken
Noah Bubenhofer (Universität Zürich)
Zürich, 22. März 2018
2 . 1
Texte lesen aus korpuslinguistischerTexte lesen aus korpuslinguistischer
SichtSicht
2 . 2
Close ReadingClose Reading
2 . 3
KorpusanalysenKorpusanalysen
2 . 4
Schmetterlingssammlung…Schmetterlingssammlung…
Foto: Chip Clark, Smithsonian Institution
2 . 5
TrampelpfadeTrampelpfade
Korpusanalyse: Krisenrhetorik bei Angela Merkel (Bundestag 2009-2013)
2 . 6
Vincent Placcius, 1689: Illustration featuring a system for filing notes, from De arte excerpendi vom gelahrten Buchhalten liber
singularis: quo genera & praecepta excerpendi, ab aliis hucusq[ue]; tradita omnia, novis accessionibus aucta, ordinata methodo
exhibentur, et suis quaeque materiis applicantur..., 1689, by Vincent Placcius (1642-1699). *GC6.P6904.689d, Houghton Library,
Harvard University
2 . 7
Busa (1951: 66) – Sancti Thomae Aquinatis Hymnorum ritualium varia specimina concordantiarum: primo saggio di indici di parole
automaticamente composti e stampi da macchine IBM a schede perforate = A 1st example of word index automatically compiled and
printed by IBM punched card machines
2 . 8
Vom Sprachgebrauch zum IndexVom Sprachgebrauch zum Index
Datenbasis (Korpus) als Ausgangspunkt für die Frage nach Regeln des
Sprachgebrauchs.
Digitale Datenverarbeitung als wichtige (und entscheidende) Triebfeder.
Doch: Die Grundlage ist diagrammatisches Operieren: Die geschickte An-
und Umordnung von Daten über Sprache!
→ Diagramm in Anlehnung an Sybille Krämer (Krämer 2016) – "Diagramme
als Denkzeuge"
2 . 9
Diagrammatische Operationen in der KorpuslinguistikDiagrammatische Operationen in der Korpuslinguistik
2 . 10
Ramelli, Agostino: „Le diverse et artificiose machine del capitano Agostino Ramelli : nellequali si contengono varij et industriosi
movimenti, degni digrandissima speculatione, per cavarne beneficio infinito in ogni sorte d’operatione : composte in lingua Italiana et
Francese“ (1588).
2 . 11
Korpuslinguistik?Korpuslinguistik?
Auflösung der Einheit des Textes in loci
Ordnung der loci:
Index / Register als Verweis auf Quelltext
Systematische Anordnung mittels diagrammatischer Mittel (KWiC-
Liste, Kollokationsprofil, Distributionsdiagramm…)
"Lektüre" als Suche nach einem emergenten Phänomen
➔ Bereits die einfache Liste (Key Word in Context) als Diagramm ermöglicht
eine neue Perspektive auf Text
3 . 1
Diagrammatische GrundoperationenDiagrammatische Grundoperationen
3 . 2
Diagrammatische Grundfiguren zur Konstitution von SpracheDiagrammatische Grundfiguren zur Konstitution von Sprache
Liste, Karte, Partitur, Vektor, Graph
3 . 3
PartiturenPartituren
Apel, Willi: The notation of polyphonic music, 900-1600, Cambridge, Mass., Mediaeval Academy of America 1961: 205
3 . 4
PartiturenPartituren
0:00
3 . 5
Partituren?Partituren?
Annotationen im Text+Berg-Korpus (Bubenhofer et al. 2015)
3 . 6
Text im digitalen Raum: VektorraumText im digitalen Raum: Vektorraum
Text fX fY
A 15 28
B 25 11
C 27 9
D 30 10
E 30 30
F 31 10
G 28 28
H 27 30
3 . 7
Grundoperationen: Auflösung der TexteinheitGrundoperationen: Auflösung der Texteinheit
3 . 8
Grundoperationen: Auflösung der SequenzialitätGrundoperationen: Auflösung der Sequenzialität
3 . 9
Grundoperationen: Anreicherung mit DimensionalitätGrundoperationen: Anreicherung mit Dimensionalität
3 . 10
GeokollokationenGeokollokationen
Schweiz: Banken, Schokolade, Berge, Steuerhinterziehung…
→ Diskursive Konstruktion von Welt
3 . 11
Geburt – Narrative MusterGeburt – Narrative Muster
Wir freuten uns – endlich waren wir auf der Zielgeraten. Die ersten 2
Presswehen waren noch gut zu meistern, ich merkte deutlich den Erfolg des
Pressens und durfte auch schon das Köpfchen mit den Fingerspitzen
berühren – herrlich!!! Dann wurde es schmerzhaft und ich dachte mir zerreißt
es das Becken … aber nach der 3. Presswehe war der Kopf endlich draußen
und mit der 4. Presswehe wurden dann auch die Schultern "rausgedrückt" –
wobei ich gerissen bin – was ich auch deutlich gespürt habe … Zum Glück
war es dann aber auch schon geschafft und ich blickte auf dieses winzige
schreiende Menschlein und musste sofort weinen … es war ein sooo
emotionaler Moment – unglaublich! Luisa begann nach wenigen Sekunden
schon nach der Brust zu suchen … wir mussten sooo lachen – ein kleiner
süßer Fresssack. Meine 2. Tochter – ein weiteres Wunder … endlich war sie
da und sie wurde mir sofort auf den Bauch gelegt! Sie macht sofort die
Augen auf und sah mich an … ein unvergesslicher Moment, so friedlich,
vollkommen und einmalig und ein Ebenbild von Pauline!!!
N., 2011-09-03, http://www.babyforum.de
3 . 12
KorpusKorpus
Forum           # Wörter      # Texte
http://www.urbia.de/ 7.364.108 8808
http://www.babyforum.de/ 2.089.936 1824
http://www.parents.at/ 1.199.174 1647
https://www.swissmomforum.ch/ 1.156.193 919
http://www.eltern.de/ 438.017 716
http://www.umstandsforum.de/ 289.807 568
Total 12.537.235 14.482
3 . 13
Der typische Geburtsbericht in FragmentenDer typische Geburtsbericht in Fragmenten
An diesem Tag hatte ich… → …, dass es endlich losgeht → ich hatte das
Gefühl, dass… → Mein Mann und ich waren… → war mich sicher, dass… →
auf den Weg in die… → Ich sagte ihr, dass… → so heftig, dass ich… →
fühlte sich an, als → war ich fix und fertig → Ich hatte das Gefühl, → dass es
nicht mehr lange… → ich dachte, ich muss… → , aber es ging nicht → , was
das Zeug hielt → dann ging alles ganz schnell → Ich weiß nur noch… → um
16:38 war es → ich konnte es nicht glauben → ich war so froh… → , dass es
vorbei war → ich hätte nie gedacht, → und ich muss sagen, → Für mich war
es eine… → noch vor sich haben…
3 . 14
Variation der GeschichtenVariation der Geschichten
0.00 0.25 0.50 0.75 1.00
0.0
0.1
0.2
0.3
0.4
Geburtsgeschichten: Typische Positionen der n-Gramme
Positionen in der Geschichte
Standardabweichung der Position
[unbestimmt]
Ärger
Ekel
Erwartung
Freude
Furcht
Traurigkeit
Vertrauen
Sentiments
Frequenz
3 . 15
Gesprochene Sprache: Interaktivität, Zeitlichkeit, SozialitätGesprochene Sprache: Interaktivität, Zeitlichkeit, Sozialität
Audiodatei: FOLK_E_00080_SE_01_A_01_DF_01.WAV 
[Doppelklick] ‑ Audio an der betreffenden Stelle abspielen / [Einfacher Klick] Audio anhalten
0001 VB so
0002 (0.33)
0003 VB jetz komm
0004 (5.07)
0005 DZ sollen wir noch mal rausgehn
0006 (0.42)
0007 DZ komm
0008 (1.87)
0009 VB °hh oh mann
0010 XW °hh
0011 (5.33)
0012 VB uah
0013 (0.34)
0014 DZ ich hä  ja gern noch einzelapplaus gehabt
0015 (0.94)
0016 DZ für diese einzelnen darsteller da warn ja so_n paar wirklich s[uper] ne
0017 VB [ja ja]
0018 (2.54)
0019 VB aber weißte was das thema hat mich_n bisschen gelangweilt
0020 (0 59)
3 . 16
Vergleich von Gesprächskonstellationen (synchron)Vergleich von Gesprächskonstellationen (synchron)
FOLK_E_00080:
Alltagsgespräch: Pausenkommunikation im
Theater
FOLK_E_00012:
Alltagsgespräch: Spielinteraktion mit
Kindern
FOLK_E_00120:
Institutionelle Kommunikation:
Unterrichtsstunde im
Wirtschaftsgymnasium
→ Angabe von typischen Konstellationen, Momenten für bestimmte
sprachliche Phänomene
3 . 17
Diagrammatische GegenstandskonstitutionDiagrammatische Gegenstandskonstitution
Visualisierungen (und algorithmische Operationen) sind dazu da, Daten neu
zu kontextualisieren und damit neu lesbar zu machen.
Geokollokationen: Mapping von Toponymen auf einer Karte
Narrative Muster: Sequenzialität von n-Grammen
Gesprochene Sprache: Zeitlichkeit und Sozialität
Der moderne Lesesaal: mit digitaler Schere, digitalem Klebstoff, digitalen
Zettelkästen an die digitalen Bücher ran!
4 . 1
KorporathekenKorporatheken
4 . 2
Inspirationen: Vannevar Bushs "Memex"Inspirationen: Vannevar Bushs "Memex"
Vannevar Bush: As we may think. The Atlantic, July 1945
4 . 3
Inspirationen: Douglas Engelbarts "oN-Line System NLS"Inspirationen: Douglas Engelbarts "oN-Line System NLS"
Douglas Engelbart / William English: A Research Center for Augmenting Human Intellect. 1968.
4 . 4
Vorab: ETH-Bibliothek ist schon fast eine Korporathek!Vorab: ETH-Bibliothek ist schon fast eine Korporathek!
ETH Data Archive
Open-Data-Strategie
Support und Training im Umgang mit Daten
…
4 . 5
KorporathekenKorporatheken
Volltextzugriff auf Texte
APIs als Schnittstellen
Plattform, um verschiedene diagrammatische Operationen mit Texten zu
erlauben
Plattform, um White- statt Black-Box-Algorithmen zur Textanalyse zu
fördern
4 . 6
Daten und AlgorithmenDaten und Algorithmen
Bislang starker Fokus auf Digitalisierung und Archivierung digitaler Daten
Weniger im Fokus: Verdatung – als Transformation der Digitalisate in
gegenseitig verrechenbare Daten
Kaum im Fokus: Maschinelle Algorithmen, White- vs. Black-Box-
Algorithmen, Hermeneutik und Algorithmen, soziale Verantwortung und
Algorithmen
→ Kuratieren von Algorithmen als Betätigungsfeld der Bibliotheken?
4 . 7
Korporatheken: SzenarioKorporatheken: Szenario
1. Ich suche nach Definitionen von "Kommunikation" in Fachbüchern im
Bestand der Bibliothek.
Anfrage über API direkt z.B. aus R oder Python
Rückgabe der Paragraphen inkl. Metadaten
4 . 8
Korporatheken: SzenarioKorporatheken: Szenario
2. Anwendung des Standardalgorithmus zur Kollokationsberechnung in den
Daten.
Algorithmus auf Plattform der Bibliothek implementiert – Code einseh- und
veränderbar
Aufrufen des Algorithmus über API (z.B. aus R oder Python)
4 . 9
Korporatheken: SzenarioKorporatheken: Szenario
3. Ich erweitere den Algorithmus um eine Visualisierungskomponente, um die
Unterschiede der Kollokationsprofile bezüglich Publikationsdatum oder
Fachbereich vergleichen zu können.
Den erweiterten Algorithmus stelle ich auf der Plattform der Bibliothek auch
anderen Benutzer/innen zur Verfügung.
Ein Klick auf ein Kollokationsprofil zeigt die dahinter liegenden Volltexte an.
Meine so erstellte Klassifikation von Definitionstypen ist als
benutzergeneriertes Metadatum im Katalog verfügbar und ermöglicht
anderen Nutzer/innen Katalogabfragen der Art:
"Zeige mir Texte, in denen folgender Typus von Kommunikation definiert
wird: Sender, Empfänger, Kanal".
Oder alternativ:
"System, strukturelle Kopplung, selbstreferentiell".
4 . 10
FazitFazit
Bibliotheken als physische und digitale Plattformen…
…die vielfältige Zugänge zu Texten, Textteilen und Metadaten erlauben…
…und dabei nicht "nur" speichern/archivieren und anzeigen/verleihen,
sondern zahlreiche diagrammatische Operationen und Transformationen
ermöglichen…
…und folgende Prinzipien hochhalten: Open Access, Open Source,
transparente Algorithmen, nicht-kommerzieller Raum, Experiment,
voneinander lernen
4 . 11
Philologisches Hacking and MakingPhilologisches Hacking and Making
SLUB (Sächsische Landes- und Universitätsbibliothek) Dresden: Makerspace
Noah Bubenhofer: Zürich, 22. März 2018 4 . 12
Philologisches Hacking and MakingPhilologisches Hacking and Making
Moritz, 7 Jahre

Weitere ähnliche Inhalte

Ähnlich wie Texte visualisieren und lesen

Literaturunterricht und medien d 2010
Literaturunterricht und medien d  2010Literaturunterricht und medien d  2010
Literaturunterricht und medien d 2010
kleemans
 
Dossier: Migrationsliteratur - Eine neue deutsche Literatur?
Dossier: Migrationsliteratur - Eine neue deutsche Literatur?Dossier: Migrationsliteratur - Eine neue deutsche Literatur?
Dossier: Migrationsliteratur - Eine neue deutsche Literatur?
Heinrich-Böll-Stiftung
 
Kuße, Tolstoj und die Sprache der Weisheit, Leseprobe, ISBN 978-3-525-56004-4
Kuße, Tolstoj und die Sprache der Weisheit, Leseprobe, ISBN 978-3-525-56004-4Kuße, Tolstoj und die Sprache der Weisheit, Leseprobe, ISBN 978-3-525-56004-4
Kuße, Tolstoj und die Sprache der Weisheit, Leseprobe, ISBN 978-3-525-56004-4
Ich
 
Werkstattbericht: Schülervorstellungen nach Zeitzeugengesprächen
Werkstattbericht: Schülervorstellungen nach ZeitzeugengesprächenWerkstattbericht: Schülervorstellungen nach Zeitzeugengesprächen
Werkstattbericht: Schülervorstellungen nach Zeitzeugengesprächen
Zeitpfeil
 
Bibliografie kurspraesentation
Bibliografie kurspraesentationBibliografie kurspraesentation
Bibliografie kurspraesentation
plainjochen
 
Vo8 2010-short
Vo8 2010-shortVo8 2010-short
Vo8 2010-short
Jan Stern
 
Vo3 2010 neu
Vo3 2010 neuVo3 2010 neu
Vo3 2010 neu
Jan Stern
 

Ähnlich wie Texte visualisieren und lesen (20)

Körper der Artikulation. Zum Verhältnis von Medialität und Anthropologie.
Körper der Artikulation. Zum Verhältnis von Medialität und Anthropologie.Körper der Artikulation. Zum Verhältnis von Medialität und Anthropologie.
Körper der Artikulation. Zum Verhältnis von Medialität und Anthropologie.
 
Kommunikationsmodelle
KommunikationsmodelleKommunikationsmodelle
Kommunikationsmodelle
 
Paul Otlet und das Mundaneum
Paul Otlet und das MundaneumPaul Otlet und das Mundaneum
Paul Otlet und das Mundaneum
 
Heureka! Bibliotheken erobern den digitalen Raum
Heureka! Bibliotheken erobern den digitalen Raum Heureka! Bibliotheken erobern den digitalen Raum
Heureka! Bibliotheken erobern den digitalen Raum
 
Christoph Fasel: Wie man schlank und zupackend schreibt
Christoph Fasel: Wie man schlank und zupackend schreibtChristoph Fasel: Wie man schlank und zupackend schreibt
Christoph Fasel: Wie man schlank und zupackend schreibt
 
Literaturunterricht und medien d 2010
Literaturunterricht und medien d  2010Literaturunterricht und medien d  2010
Literaturunterricht und medien d 2010
 
Historische Dokumentation und Archivierung - Einführung in die Archivwissensc...
Historische Dokumentation und Archivierung - Einführung in die Archivwissensc...Historische Dokumentation und Archivierung - Einführung in die Archivwissensc...
Historische Dokumentation und Archivierung - Einführung in die Archivwissensc...
 
Dossier: Migrationsliteratur - Eine neue deutsche Literatur?
Dossier: Migrationsliteratur - Eine neue deutsche Literatur?Dossier: Migrationsliteratur - Eine neue deutsche Literatur?
Dossier: Migrationsliteratur - Eine neue deutsche Literatur?
 
Kuße, Tolstoj und die Sprache der Weisheit, Leseprobe, ISBN 978-3-525-56004-4
Kuße, Tolstoj und die Sprache der Weisheit, Leseprobe, ISBN 978-3-525-56004-4Kuße, Tolstoj und die Sprache der Weisheit, Leseprobe, ISBN 978-3-525-56004-4
Kuße, Tolstoj und die Sprache der Weisheit, Leseprobe, ISBN 978-3-525-56004-4
 
Werkstattbericht: Schülervorstellungen nach Zeitzeugengesprächen
Werkstattbericht: Schülervorstellungen nach ZeitzeugengesprächenWerkstattbericht: Schülervorstellungen nach Zeitzeugengesprächen
Werkstattbericht: Schülervorstellungen nach Zeitzeugengesprächen
 
Fu Jen 2009
Fu Jen 2009Fu Jen 2009
Fu Jen 2009
 
Bibliografie kurspraesentation
Bibliografie kurspraesentationBibliografie kurspraesentation
Bibliografie kurspraesentation
 
Vo8 2010-short
Vo8 2010-shortVo8 2010-short
Vo8 2010-short
 
St
StSt
St
 
Vo3 2010 neu
Vo3 2010 neuVo3 2010 neu
Vo3 2010 neu
 
Neo-70er. Oder: Bibliotheken werden nicht getrieben, sie erfinden nur ständig...
Neo-70er. Oder: Bibliotheken werden nicht getrieben, sie erfinden nur ständig...Neo-70er. Oder: Bibliotheken werden nicht getrieben, sie erfinden nur ständig...
Neo-70er. Oder: Bibliotheken werden nicht getrieben, sie erfinden nur ständig...
 
Hintzes Kategorie der Erzählung im Neuägyptischen – zwischen Stil und Gramma...
Hintzes Kategorie der Erzählung im Neuägyptischen – zwischen Stil und Gramma...Hintzes Kategorie der Erzählung im Neuägyptischen – zwischen Stil und Gramma...
Hintzes Kategorie der Erzählung im Neuägyptischen – zwischen Stil und Gramma...
 
"Struggle for Existence" - Existenzökonomie: Diktatur des Individuums
"Struggle for Existence" - Existenzökonomie: Diktatur des Individuums "Struggle for Existence" - Existenzökonomie: Diktatur des Individuums
"Struggle for Existence" - Existenzökonomie: Diktatur des Individuums
 
Zwangsarbeit im Nationalsozialismus
Zwangsarbeit im NationalsozialismusZwangsarbeit im Nationalsozialismus
Zwangsarbeit im Nationalsozialismus
 
Iclonlitdaf2012
Iclonlitdaf2012Iclonlitdaf2012
Iclonlitdaf2012
 

Mehr von ETH-Bibliothek

Mehr von ETH-Bibliothek (20)

17:15 Kolloquium – Donnerstag, 27. Februar 2020 – Das Büro darf nicht nur Mit...
17:15 Kolloquium – Donnerstag, 27. Februar 2020 – Das Büro darf nicht nur Mit...17:15 Kolloquium – Donnerstag, 27. Februar 2020 – Das Büro darf nicht nur Mit...
17:15 Kolloquium – Donnerstag, 27. Februar 2020 – Das Büro darf nicht nur Mit...
 
10 YearsDOI Desk at ETH Zurich
10 YearsDOI Desk at ETH Zurich10 YearsDOI Desk at ETH Zurich
10 YearsDOI Desk at ETH Zurich
 
OriginStamp: Trusted Time Stamping via the Bitcoin Blockchain
OriginStamp: Trusted Time Stamping via the Bitcoin BlockchainOriginStamp: Trusted Time Stamping via the Bitcoin Blockchain
OriginStamp: Trusted Time Stamping via the Bitcoin Blockchain
 
Tracking Citations to Research Software via PIDs
Tracking Citations to Research Software via PIDsTracking Citations to Research Software via PIDs
Tracking Citations to Research Software via PIDs
 
Persistent Identifiers for Scientific Data at CSCS
Persistent Identifiers for Scientific Data at CSCSPersistent Identifiers for Scientific Data at CSCS
Persistent Identifiers for Scientific Data at CSCS
 
Building Open Research Infrastructure with PIDs
Building Open Research Infrastructure with PIDsBuilding Open Research Infrastructure with PIDs
Building Open Research Infrastructure with PIDs
 
DataCite and its Members: Connecting Research and Identifying Knowledge
DataCite and its Members: Connecting Research and Identifying KnowledgeDataCite and its Members: Connecting Research and Identifying Knowledge
DataCite and its Members: Connecting Research and Identifying Knowledge
 
Bilder online recherchieren – Tipps und Tricks
Bilder online recherchieren – Tipps und TricksBilder online recherchieren – Tipps und Tricks
Bilder online recherchieren – Tipps und Tricks
 
Transkribus. Eine Forschungsplattform für die automatisierte Digitalisierung,...
Transkribus. Eine Forschungsplattform für die automatisierte Digitalisierung,...Transkribus. Eine Forschungsplattform für die automatisierte Digitalisierung,...
Transkribus. Eine Forschungsplattform für die automatisierte Digitalisierung,...
 
Herausforderungen im Datenmanagement von Metadaten
Herausforderungen im Datenmanagement von MetadatenHerausforderungen im Datenmanagement von Metadaten
Herausforderungen im Datenmanagement von Metadaten
 
Gamification und Game Design: Theorie und Praxis jenseits der Heilsversprechu...
Gamification und Game Design: Theorie und Praxis jenseits der Heilsversprechu...Gamification und Game Design: Theorie und Praxis jenseits der Heilsversprechu...
Gamification und Game Design: Theorie und Praxis jenseits der Heilsversprechu...
 
Data Management in Research –WhyandHow?
Data Management in Research –WhyandHow?Data Management in Research –WhyandHow?
Data Management in Research –WhyandHow?
 
Openness, exchange, FAIR DATA – oh brave new world that has such vision! (Dr....
Openness, exchange, FAIR DATA – oh brave new world that has such vision! (Dr....Openness, exchange, FAIR DATA – oh brave new world that has such vision! (Dr....
Openness, exchange, FAIR DATA – oh brave new world that has such vision! (Dr....
 
CitizenScience - Freiwillige lokalisieren Bilder im virtuellen Globus
CitizenScience - Freiwillige lokalisieren Bilder im virtuellen GlobusCitizenScience - Freiwillige lokalisieren Bilder im virtuellen Globus
CitizenScience - Freiwillige lokalisieren Bilder im virtuellen Globus
 
FORUM - Das Bottom-up Gremium der ETH-Bibliothek
FORUM - Das Bottom-up Gremium der ETH-BibliothekFORUM - Das Bottom-up Gremium der ETH-Bibliothek
FORUM - Das Bottom-up Gremium der ETH-Bibliothek
 
Digitaler Zugang zu Lesespuren - Das Projekt „Thomas Mann Nachlassbibliothek“...
Digitaler Zugang zu Lesespuren - Das Projekt „Thomas Mann Nachlassbibliothek“...Digitaler Zugang zu Lesespuren - Das Projekt „Thomas Mann Nachlassbibliothek“...
Digitaler Zugang zu Lesespuren - Das Projekt „Thomas Mann Nachlassbibliothek“...
 
„Ex meis libris“ - Die Provenienzdatenbank der ETH-Bibliothek
„Ex meis libris“ - Die Provenienzdatenbank der ETH-Bibliothek „Ex meis libris“ - Die Provenienzdatenbank der ETH-Bibliothek
„Ex meis libris“ - Die Provenienzdatenbank der ETH-Bibliothek
 
Wenn Algorithmen Zeitschriften lesen - Vom Mehrwert automatisierter Textanrei...
Wenn Algorithmen Zeitschriften lesen - Vom Mehrwert automatisierter Textanrei...Wenn Algorithmen Zeitschriften lesen - Vom Mehrwert automatisierter Textanrei...
Wenn Algorithmen Zeitschriften lesen - Vom Mehrwert automatisierter Textanrei...
 
Die Research Collection der ETH Zürich - Ein Repositorium für Publikationen u...
Die Research Collection der ETH Zürich - Ein Repositorium für Publikationen u...Die Research Collection der ETH Zürich - Ein Repositorium für Publikationen u...
Die Research Collection der ETH Zürich - Ein Repositorium für Publikationen u...
 
The ETH Zurich DOI Desk
The ETH Zurich DOI Desk The ETH Zurich DOI Desk
The ETH Zurich DOI Desk
 

Texte visualisieren und lesen

  • 1. 1 Texte visualisieren und lesenTexte visualisieren und lesen Über linguistische Lektüren im digitalenÜber linguistische Lektüren im digitalen Zeitalter und die Rolle der BibliothekenZeitalter und die Rolle der Bibliotheken Noah Bubenhofer (Universität Zürich) Zürich, 22. März 2018
  • 2. 2 . 1 Texte lesen aus korpuslinguistischerTexte lesen aus korpuslinguistischer SichtSicht
  • 3. 2 . 2 Close ReadingClose Reading
  • 6. 2 . 5 TrampelpfadeTrampelpfade Korpusanalyse: Krisenrhetorik bei Angela Merkel (Bundestag 2009-2013)
  • 7. 2 . 6 Vincent Placcius, 1689: Illustration featuring a system for filing notes, from De arte excerpendi vom gelahrten Buchhalten liber singularis: quo genera & praecepta excerpendi, ab aliis hucusq[ue]; tradita omnia, novis accessionibus aucta, ordinata methodo exhibentur, et suis quaeque materiis applicantur..., 1689, by Vincent Placcius (1642-1699). *GC6.P6904.689d, Houghton Library, Harvard University
  • 8. 2 . 7 Busa (1951: 66) – Sancti Thomae Aquinatis Hymnorum ritualium varia specimina concordantiarum: primo saggio di indici di parole automaticamente composti e stampi da macchine IBM a schede perforate = A 1st example of word index automatically compiled and printed by IBM punched card machines
  • 9. 2 . 8 Vom Sprachgebrauch zum IndexVom Sprachgebrauch zum Index Datenbasis (Korpus) als Ausgangspunkt für die Frage nach Regeln des Sprachgebrauchs. Digitale Datenverarbeitung als wichtige (und entscheidende) Triebfeder. Doch: Die Grundlage ist diagrammatisches Operieren: Die geschickte An- und Umordnung von Daten über Sprache! → Diagramm in Anlehnung an Sybille Krämer (Krämer 2016) – "Diagramme als Denkzeuge"
  • 10. 2 . 9 Diagrammatische Operationen in der KorpuslinguistikDiagrammatische Operationen in der Korpuslinguistik
  • 11. 2 . 10 Ramelli, Agostino: „Le diverse et artificiose machine del capitano Agostino Ramelli : nellequali si contengono varij et industriosi movimenti, degni digrandissima speculatione, per cavarne beneficio infinito in ogni sorte d’operatione : composte in lingua Italiana et Francese“ (1588).
  • 12. 2 . 11 Korpuslinguistik?Korpuslinguistik? Auflösung der Einheit des Textes in loci Ordnung der loci: Index / Register als Verweis auf Quelltext Systematische Anordnung mittels diagrammatischer Mittel (KWiC- Liste, Kollokationsprofil, Distributionsdiagramm…) "Lektüre" als Suche nach einem emergenten Phänomen ➔ Bereits die einfache Liste (Key Word in Context) als Diagramm ermöglicht eine neue Perspektive auf Text
  • 13. 3 . 1 Diagrammatische GrundoperationenDiagrammatische Grundoperationen
  • 14. 3 . 2 Diagrammatische Grundfiguren zur Konstitution von SpracheDiagrammatische Grundfiguren zur Konstitution von Sprache Liste, Karte, Partitur, Vektor, Graph
  • 15. 3 . 3 PartiturenPartituren Apel, Willi: The notation of polyphonic music, 900-1600, Cambridge, Mass., Mediaeval Academy of America 1961: 205
  • 17. 3 . 5 Partituren?Partituren? Annotationen im Text+Berg-Korpus (Bubenhofer et al. 2015)
  • 18. 3 . 6 Text im digitalen Raum: VektorraumText im digitalen Raum: Vektorraum Text fX fY A 15 28 B 25 11 C 27 9 D 30 10 E 30 30 F 31 10 G 28 28 H 27 30
  • 19. 3 . 7 Grundoperationen: Auflösung der TexteinheitGrundoperationen: Auflösung der Texteinheit
  • 20. 3 . 8 Grundoperationen: Auflösung der SequenzialitätGrundoperationen: Auflösung der Sequenzialität
  • 21. 3 . 9 Grundoperationen: Anreicherung mit DimensionalitätGrundoperationen: Anreicherung mit Dimensionalität
  • 22. 3 . 10 GeokollokationenGeokollokationen Schweiz: Banken, Schokolade, Berge, Steuerhinterziehung… → Diskursive Konstruktion von Welt
  • 23. 3 . 11 Geburt – Narrative MusterGeburt – Narrative Muster Wir freuten uns – endlich waren wir auf der Zielgeraten. Die ersten 2 Presswehen waren noch gut zu meistern, ich merkte deutlich den Erfolg des Pressens und durfte auch schon das Köpfchen mit den Fingerspitzen berühren – herrlich!!! Dann wurde es schmerzhaft und ich dachte mir zerreißt es das Becken … aber nach der 3. Presswehe war der Kopf endlich draußen und mit der 4. Presswehe wurden dann auch die Schultern "rausgedrückt" – wobei ich gerissen bin – was ich auch deutlich gespürt habe … Zum Glück war es dann aber auch schon geschafft und ich blickte auf dieses winzige schreiende Menschlein und musste sofort weinen … es war ein sooo emotionaler Moment – unglaublich! Luisa begann nach wenigen Sekunden schon nach der Brust zu suchen … wir mussten sooo lachen – ein kleiner süßer Fresssack. Meine 2. Tochter – ein weiteres Wunder … endlich war sie da und sie wurde mir sofort auf den Bauch gelegt! Sie macht sofort die Augen auf und sah mich an … ein unvergesslicher Moment, so friedlich, vollkommen und einmalig und ein Ebenbild von Pauline!!! N., 2011-09-03, http://www.babyforum.de
  • 24. 3 . 12 KorpusKorpus Forum           # Wörter      # Texte http://www.urbia.de/ 7.364.108 8808 http://www.babyforum.de/ 2.089.936 1824 http://www.parents.at/ 1.199.174 1647 https://www.swissmomforum.ch/ 1.156.193 919 http://www.eltern.de/ 438.017 716 http://www.umstandsforum.de/ 289.807 568 Total 12.537.235 14.482
  • 25. 3 . 13 Der typische Geburtsbericht in FragmentenDer typische Geburtsbericht in Fragmenten An diesem Tag hatte ich… → …, dass es endlich losgeht → ich hatte das Gefühl, dass… → Mein Mann und ich waren… → war mich sicher, dass… → auf den Weg in die… → Ich sagte ihr, dass… → so heftig, dass ich… → fühlte sich an, als → war ich fix und fertig → Ich hatte das Gefühl, → dass es nicht mehr lange… → ich dachte, ich muss… → , aber es ging nicht → , was das Zeug hielt → dann ging alles ganz schnell → Ich weiß nur noch… → um 16:38 war es → ich konnte es nicht glauben → ich war so froh… → , dass es vorbei war → ich hätte nie gedacht, → und ich muss sagen, → Für mich war es eine… → noch vor sich haben…
  • 26. 3 . 14 Variation der GeschichtenVariation der Geschichten 0.00 0.25 0.50 0.75 1.00 0.0 0.1 0.2 0.3 0.4 Geburtsgeschichten: Typische Positionen der n-Gramme Positionen in der Geschichte Standardabweichung der Position [unbestimmt] Ärger Ekel Erwartung Freude Furcht Traurigkeit Vertrauen Sentiments Frequenz
  • 27. 3 . 15 Gesprochene Sprache: Interaktivität, Zeitlichkeit, SozialitätGesprochene Sprache: Interaktivität, Zeitlichkeit, Sozialität Audiodatei: FOLK_E_00080_SE_01_A_01_DF_01.WAV  [Doppelklick] ‑ Audio an der betreffenden Stelle abspielen / [Einfacher Klick] Audio anhalten 0001 VB so 0002 (0.33) 0003 VB jetz komm 0004 (5.07) 0005 DZ sollen wir noch mal rausgehn 0006 (0.42) 0007 DZ komm 0008 (1.87) 0009 VB °hh oh mann 0010 XW °hh 0011 (5.33) 0012 VB uah 0013 (0.34) 0014 DZ ich hä  ja gern noch einzelapplaus gehabt 0015 (0.94) 0016 DZ für diese einzelnen darsteller da warn ja so_n paar wirklich s[uper] ne 0017 VB [ja ja] 0018 (2.54) 0019 VB aber weißte was das thema hat mich_n bisschen gelangweilt 0020 (0 59)
  • 28. 3 . 16 Vergleich von Gesprächskonstellationen (synchron)Vergleich von Gesprächskonstellationen (synchron) FOLK_E_00080: Alltagsgespräch: Pausenkommunikation im Theater FOLK_E_00012: Alltagsgespräch: Spielinteraktion mit Kindern FOLK_E_00120: Institutionelle Kommunikation: Unterrichtsstunde im Wirtschaftsgymnasium → Angabe von typischen Konstellationen, Momenten für bestimmte sprachliche Phänomene
  • 29. 3 . 17 Diagrammatische GegenstandskonstitutionDiagrammatische Gegenstandskonstitution Visualisierungen (und algorithmische Operationen) sind dazu da, Daten neu zu kontextualisieren und damit neu lesbar zu machen. Geokollokationen: Mapping von Toponymen auf einer Karte Narrative Muster: Sequenzialität von n-Grammen Gesprochene Sprache: Zeitlichkeit und Sozialität Der moderne Lesesaal: mit digitaler Schere, digitalem Klebstoff, digitalen Zettelkästen an die digitalen Bücher ran!
  • 31. 4 . 2 Inspirationen: Vannevar Bushs "Memex"Inspirationen: Vannevar Bushs "Memex" Vannevar Bush: As we may think. The Atlantic, July 1945
  • 32. 4 . 3 Inspirationen: Douglas Engelbarts "oN-Line System NLS"Inspirationen: Douglas Engelbarts "oN-Line System NLS" Douglas Engelbart / William English: A Research Center for Augmenting Human Intellect. 1968.
  • 33. 4 . 4 Vorab: ETH-Bibliothek ist schon fast eine Korporathek!Vorab: ETH-Bibliothek ist schon fast eine Korporathek! ETH Data Archive Open-Data-Strategie Support und Training im Umgang mit Daten …
  • 34. 4 . 5 KorporathekenKorporatheken Volltextzugriff auf Texte APIs als Schnittstellen Plattform, um verschiedene diagrammatische Operationen mit Texten zu erlauben Plattform, um White- statt Black-Box-Algorithmen zur Textanalyse zu fördern
  • 35. 4 . 6 Daten und AlgorithmenDaten und Algorithmen Bislang starker Fokus auf Digitalisierung und Archivierung digitaler Daten Weniger im Fokus: Verdatung – als Transformation der Digitalisate in gegenseitig verrechenbare Daten Kaum im Fokus: Maschinelle Algorithmen, White- vs. Black-Box- Algorithmen, Hermeneutik und Algorithmen, soziale Verantwortung und Algorithmen → Kuratieren von Algorithmen als Betätigungsfeld der Bibliotheken?
  • 36. 4 . 7 Korporatheken: SzenarioKorporatheken: Szenario 1. Ich suche nach Definitionen von "Kommunikation" in Fachbüchern im Bestand der Bibliothek. Anfrage über API direkt z.B. aus R oder Python Rückgabe der Paragraphen inkl. Metadaten
  • 37. 4 . 8 Korporatheken: SzenarioKorporatheken: Szenario 2. Anwendung des Standardalgorithmus zur Kollokationsberechnung in den Daten. Algorithmus auf Plattform der Bibliothek implementiert – Code einseh- und veränderbar Aufrufen des Algorithmus über API (z.B. aus R oder Python)
  • 38. 4 . 9 Korporatheken: SzenarioKorporatheken: Szenario 3. Ich erweitere den Algorithmus um eine Visualisierungskomponente, um die Unterschiede der Kollokationsprofile bezüglich Publikationsdatum oder Fachbereich vergleichen zu können. Den erweiterten Algorithmus stelle ich auf der Plattform der Bibliothek auch anderen Benutzer/innen zur Verfügung. Ein Klick auf ein Kollokationsprofil zeigt die dahinter liegenden Volltexte an. Meine so erstellte Klassifikation von Definitionstypen ist als benutzergeneriertes Metadatum im Katalog verfügbar und ermöglicht anderen Nutzer/innen Katalogabfragen der Art: "Zeige mir Texte, in denen folgender Typus von Kommunikation definiert wird: Sender, Empfänger, Kanal". Oder alternativ: "System, strukturelle Kopplung, selbstreferentiell".
  • 39. 4 . 10 FazitFazit Bibliotheken als physische und digitale Plattformen… …die vielfältige Zugänge zu Texten, Textteilen und Metadaten erlauben… …und dabei nicht "nur" speichern/archivieren und anzeigen/verleihen, sondern zahlreiche diagrammatische Operationen und Transformationen ermöglichen… …und folgende Prinzipien hochhalten: Open Access, Open Source, transparente Algorithmen, nicht-kommerzieller Raum, Experiment, voneinander lernen
  • 40. 4 . 11 Philologisches Hacking and MakingPhilologisches Hacking and Making SLUB (Sächsische Landes- und Universitätsbibliothek) Dresden: Makerspace
  • 41. Noah Bubenhofer: Zürich, 22. März 2018 4 . 12 Philologisches Hacking and MakingPhilologisches Hacking and Making Moritz, 7 Jahre