IT for All:Digitale Datenanalyse in den
Geschichts- und Kunstwissenschaften
IT for All:
Digitale Datenanalyse in den
Geschichts- und Kunstwissenschaften
Digital Humanities Virtual Laboratory
(DHVLab)
Prof. Dr. Hubertus Kohle, Kunstgeschichte
Dr. Christian Riepl, IT-Gruppe Geisteswissenschaften
FAU, Institut für Lern-Innovation – 19. April 2018
2.
1. Organisatorischer Hintergrund
2.Konzept der Wissensvermittlung
3. Architektur des DHVLab
4. Komponenten des DHVLab
5. Einsatz und Erfahrungen
6. Zukunftsperspektiven
IT for All: Digitale Datenanalyse in den
Geschichts- und Kunstwissenschaften
3.
1. Organisatorischer Hintergrund
2.Konzept der Wissensvermittlung
3. Architektur des DHVLab
4. Komponenten des DHVLab
5. Einsatz und Erfahrungen
6. Zukunftsperspektiven
IT for All: Digitale Datenanalyse in den
Geschichts- und Kunstwissenschaften
4.
IT-Gruppe Geisteswissenschaften
DH Kompetenz-und Datenzentrum
IT-Infrastruktur
Forschung & Lehre
digital
Forschungsdaten-
management
IT for All: Digitale Datenanalyse in den
Geschichts- und Kunstwissenschaften
5.
Kooperation und Vernetzung
ITGDezernat VIUB LMU
IT for All: Digitale Datenanalyse in den
Geschichts- und Kunstwissenschaften
LRZ
(GeRDI)
dhmuc. Netzwerk DH München
(BADW, BSB, DM, LMU, …?)
téchnē – Campus-Netzwerk
Digitale Geistes- und Sozialwissenschaften
(FAU, UR, LMU, …?)
Geisteswissenschaften Informatik/Statistik
UB FAU
6.
M
ultiBH
t
Artem
is
BM
LO
AsiCa
Artigo
p4s
ASD
RSQ
V
GS CoL /MA / BA
KiT
DHVLab
IT for All: Digitale Datenanalyse in den
Geschichts- und Kunstwissenschaften
Geo-/Korpuslinguistik
Bild
VA
Person/Objekt
Text/Sprach
e
Stand 2018: über 380 Datenbanken (125 Projektdatenbanken)
7.
Digitaler Campus Bayern
•2016:IT for All: Digitale Datenanalyse
• Geschichts- und Kunstwissenschaften der LMU
•2017: BA-Nebenfach „Digital Humanities -
Sprachwissenschaften“
• Sprachwissenschaften der LMU (Anglistik, Germanistik, Romanistik)
• FAU Erlangen
• Universität Regensburg
•2018: Forschungsdatenmanagement Bayern
• Universitätsbibliotheken der FAU und LMU mit VerbaAlpina und GeRDI
IT for All: Digitale Datenanalyse in den
Geschichts- und Kunstwissenschaften
DHVLab I
DHVLab II
DHVLab II+
8.
DHVLab-Team
•Prof. Dr. HubertusKohle (Kunstgeschichte)
•Prof. Dr. Mark Hengerer (Geschichte)
•Prof. Dr. Thomas Krefeld (Romanistik)
•Dr. Christian Riepl (ITG)
•Dr. Stephan Lücke (ITG)
•Dipl. Inform. Linus Kohl (Informatik)
•Julian Schulz, M.A. (ITG/Geschichte)
•Stefanie Schneider, B.Sc. (ITG/Statistik)
•Dr. Harald Klinke, M.Sc. (Kunstgeschichte)
•Dr. Gerhard Schön, Dr. des. Markus Frank, Tobias Englmeier M.A., Axel
Wisiorek, M.A. (ITG/Geschichte/Linguistik/Computerlinguistik)
•Konstantinos Rigas, Jan Lindner (ITG/Technik)
IT for All: Digitale Datenanalyse in den
Geschichts- und Kunstwissenschaften
9.
1. Organisatorischer Hintergrund
2.Konzept der Wissensvermittlung
3. Architektur des DHVLab
4. Komponenten des DHVLab
5. Einsatz und Erfahrungen
6. Zukunftsperspektiven
IT for All: Digitale Datenanalyse in den
Geschichts- und Kunstwissenschaften
10.
Konzept der Wissensvermittlung
•Ziel:Vermittlung von
• allgemeinen IT-Kenntnissen
• speziellen Kenntnissen in Informatik und Statistik
• Umgang mit großen digitalen Datensammlungen
•Zielgruppe: Studierende technikferner Studiengänge
•Spezifik historischer Datenbestände (Sammlung, Analyse)
IT for All: Digitale Datenanalyse in den
Geschichts- und Kunstwissenschaften
11.
Konzept der Wissensvermittlung
•Fachwissenschaft
•fachnah und praxisbezogen
• am Gegenstand historischer/kunstwissenschaftlicher Fächer
• fachspezifische Methodik und Kompetenzen
•Kompetenzen in Informatik/Statistik
• Akquisition
• Annotation
• Analyse
• Visualisierung
IT for All: Digitale Datenanalyse in den
Geschichts- und Kunstwissenschaften
12.
Konzept der Wissensvermittlung
•Veranstaltungen
•interdisziplinär und kooperativ
• Präsenzveranstaltungen basierend auf Online-Komponente
•Online-Komponente mit vier Modulen: DHVLab
• virtuelle Rechenumgebung
• Datenrepository
• Dokumentations-/Publikationsumgebung
• Lehr-/Lernumgebung
• einheitliche Software-Umgebung und niedrige Einstiegshürde
IT for All: Digitale Datenanalyse in den
Geschichts- und Kunstwissenschaften
13.
1. Organisatorischer Hintergrund
2.Konzept der Wissensvermittlung
3. Architektur des DHVLab
4. Komponenten des DHVLab
5. Einsatz in der akademischen Lehre
6. Zukunftsperspektiven
IT for All: Digitale Datenanalyse in den
Geschichts- und Kunstwissenschaften
14.
Architektur
•virtualisierte Lösung
• flexibleRessourcenverteilung
• Skalierbarkeit
•Zentralisierung von Backup, Logging und Monitoring
•webbasierte Dienste
•angebunden an zentrale Verwaltungsdienste (LDAP)
IT for All: Digitale Datenanalyse in den
Geschichts- und Kunstwissenschaften
15.
IT for All:Digitale Datenanalyse in den
Geschichts- und Kunstwissenschaften
5 Server
1 Storage (ca. 6 TB)
16.
1. Organisatorischer Hintergrund
2.Konzept der Wissensvermittlung
3. Architektur des DHVLab
4. Komponenten des DHVLab
5. Einsatz und Erfahrungen
6. Zukunftsperspektiven
IT for All: Digitale Datenanalyse in den
Geschichts- und Kunstwissenschaften
17.
IT for All:Digitale Datenanalyse in den
Geschichts- und Kunstwissenschaften
18.
IT for All:Digitale Datenanalyse in den
Geschichts- und Kunstwissenschaften
Registrierung für
Studierende
19.
IT for All:Digitale Datenanalyse in den
Geschichts- und Kunstwissenschaften
• Admin (ITG)
• legt Account mit Rolle Dozent an
• Dozent
• legt Laboratory (Lab) an
• Studierende
• registrieren sich mit Name, Vorname, E-Mail-Adresse und Passwort
• melden sich an Lab an
• Dozent schaltet frei
Management UI
eine Benutzerkennung
für alle Module
20.
• mehrere Desktopsund ssh
• vorinstallierte Software
• Editoren (vi, jEdit mit xml plugin)
• Programminterpreter/Compiler
(python)
• OCR-Programme (tesseract)
• POS-Tagger (treetagger)
• MySQL-Client (Zugriff auf DB-Server)
• R und R-Studio
• QGIS
• u.a.
IT for All: Digitale Datenanalyse in den
Geschichts- und Kunstwissenschaften
21.
IT for All:Digitale Datenanalyse in den
Geschichts- und Kunstwissenschaften
22.
• DBMS MySQL
•Benutzeroberfläche phpmyadmin
• Datenbanken
• Projekte (zentral)
• Labors
• Studierende
• Nachhaltigkeit
• Qualitätsmanagement (Lehrende)
• dauerhafte Speicherung
• nachnutzbar
• kollaborative Datensammlung
IT for All: Digitale Datenanalyse in den
Geschichts- und Kunstwissenschaften
23.
IT for All:Digitale Datenanalyse in den
Geschichts- und Kunstwissenschaften
24.
• WordPress-Plattform
• veranstaltungsbegleitende
Dokumentation
•Verknüpfung zu Datenbanken
• Visualisierung
• Publikationsmöglichkeit
• wiederverwendbare und
nachnutzbare Module
• wachsendes Wissensrepositorium
IT for All: Digitale Datenanalyse in den
Geschichts- und Kunstwissenschaften
25.
IT for All:Digitale Datenanalyse in den
Geschichts- und Kunstwissenschaften
26.
• Handbücher
• allgemeineEinführungen
• an Geisteswissenschaften orientiert
• DHVLab, Tabellenkalkulation,
Datenbanken (SQL), Statistik (R)
• Anwendungsfälle
• konkrete Anwendungen zum
vertieften Selbststudium
• „Datenbankabfragen mit R und SQL“
• „Vom gedruckten Buch zur digitalen
Karte“
• „Digitales Edieren in der Praxis“
IT for All: Digitale Datenanalyse in den
Geschichts- und Kunstwissenschaften
27.
• Analysecenter
• statistischeModellierung
• Auswertung und Visualisierung
• Daten der Kunstgeschichte
• Squirrel
• Verknüpfung Bild-Text
• Transkription und Annotation
• digitale Edition
IT for All: Digitale Datenanalyse in den
Geschichts- und Kunstwissenschaften
Squirrel
28.
IT for All:Digitale Datenanalyse in den
Geschichts- und Kunstwissenschaften
29.
IT for All:Digitale Datenanalyse in den
Geschichts- und Kunstwissenschaften
30.
IT for All:Digitale Datenanalyse in den
Geschichts- und Kunstwissenschaften
• Datenaustausch
mit virtuellem
Desktop
• jupyter note-
book:
Programmierung
• Gitlab:
versionierte
Datenablage
• mattermost:
Kommunikation
1. Organisatorischer Hintergrund
2.Konzept der Wissensvermittlung
3. Architektur des DHVLab
4. Komponenten des DHVLab
5. Einsatz und Erfahrungen
6. Zukunftsperspektiven
IT for All: Digitale Datenanalyse in den
Geschichts- und Kunstwissenschaften
33.
Einsatz in derakademischen Lehre
•Sommersemester 2016
• Dürer Digital (Klinke)
• Wiki, WordPress, XML ... und ich? Digital Humanities und Frühe Neuzeit (Hengerer /
Schön)
• Grundlagen linguistischer Korpusarbeit (Wisiorek)
• dhmuc-Summerschool 2016 (BADW, LMU, DM, BSB am DM)
•Wintersemester 2016/2017
• Big Data in der Kunstgeschichte (Kohle / Schneider)
• Monarchie und Begräbniskultur im Europa der Frühen Neuzeit (Hengerer / Schulz)
• Digitale Methoden für Historiker/-innen (Joas)
• Strukturierung und Analyse linguistischer Korpusdaten (Lücke / Riepl)
• Beschreibung, Abbildung und Visualisierung von Sprache und Text (Lücke / Riepl)
IT for All: Digitale Datenanalyse in den
Geschichts- und Kunstwissenschaften
34.
Einsatz in derakademischen Lehre
•Sommersemester 2017
• Digital Humanities. Automatische und manuelle Bildadressierung in der
Kunstgeschichte (Kohle / Schneider)
• Digitale Urkundeneditionen – Innovative Zugänge zu mittelalterlichen
Originalquellen (Schulz / Weileder)
• Zivilgesellschaft, Ehrenamt und Vereine Entwicklung einer engagierten‒
Bürgergesellschaft im 20. Jahrhundert in Bayern (Schulz / Wagner)
• Eisenzeit digital: Datenanalyse mit MySQL und QGIS (Lücke / von Nicolai)
• Strukturierung und Analyse linguistischer Korpusdaten (Lücke / Riepl)
• Beschreibung, Abbildung und Visualisierung von Sprache und Text (Lücke / Riepl)
• dhmuc-Summerschool 2017 (BADW, LMU, DM, BSB am LRZ)
IT for All: Digitale Datenanalyse in den
Geschichts- und Kunstwissenschaften
35.
Einsatz in derakademischen Lehre
•Wintersemester 2017/2018
• Ordnung ins Chaos - Digitale Netzwerkanalyse am Beispiel mittelalterlicher
Geschichtsschreibung (Beck / Krumm)
• Zwischen Ausgrabung, Archiv und Ausstellung: das Münchner Marstallmuseum
(Hengerer / Pfannmüller)
• Textedition und Textanalyse digital - eine Einführung (Hadersbeck / Prof. Dr. Mark
Hengerer / Schön)
• Strukturierung und Analyse linguistischer Korpusdaten (Lücke / Riepl)
• Beschreibung, Abbildung und Visualisierung von Sprache und Text (Lücke / Riepl)
• Grundlagen der Programmierung + Übung zum Kurs (Frank / Englmeier)
IT for All: Digitale Datenanalyse in den
Geschichts- und Kunstwissenschaften
36.
Einsatz in derakademischen Lehre
•Sommersemester 2018
• Computergestützte Analyse von Museumsdatenbanken (Kohle / Schneider)
• Einführung in die Informatik für Historiker (Schön)
• Strukturierung und Analyse linguistischer Korpusdaten (Lücke / Riepl)
• Beschreibung, Abbildung und Visualisierung von Sprache und Text (Lücke / Riepl)
• Einführung in die Datenmodellierung (Englmeier / Frank) + Übung zum Kurs
• Erweiterungsmodul Computerlinguistik: Maschinelle Übersetzung (Zangenfeind)
Universität Regensburg
• Survey- und Experimentdesign (Elsweiler / Kattenbeck) + Übung zum Kurs
•Demo Lab
• Interessenten der Universitäten Augsburg, Bamberg, Erlangen, Göttingen,
Graz, Mainz, München
IT for All: Digitale Datenanalyse in den
Geschichts- und Kunstwissenschaften
37.
Einsatz in derForschung
•Labs für Forschungsprojekte
• Bernhard von Waging Schriften
• Frühneuzeitliche Reisetagebücher
• Deutschsprachige Urkunden in Ungarn
• Stammbücher in Venedig
•Promovierende der Graduiertenschule Language & Literature
Munich, Class of Language
• Labor KorpLing-CoL mit 17 Text-/Sprachkorpus-Datenbanken
IT for All: Digitale Datenanalyse in den
Geschichts- und Kunstwissenschaften
38.
Erfahrungen
•erster Prototyp relativfrüh in Praxis eingesetzt
•laufende Optimierung
• Systemarchitektur, Serverhardware und Netzanbindung
•laufende Erweiterung/Ausweitung
• Module (Analysecenter, Squirrel, dh-lehre)
• Softwarepakete auf virtuellem Desktop
• Fachbereiche (Kunstgeschichte, Geschichte, Linguistik, Archäologie)
• Manuale und Kursszenarien
• Anzahl der Teilnehmenden (bis 15, bis 25, bis 60 pro Labor)
• Universitäten im téchnē – Campus-Netzwerk
IT for All: Digitale Datenanalyse in den
Geschichts- und Kunstwissenschaften
39.
Erfahrungen
•positives Feedback vonLehrenden und Studierenden
• einfache Labor- und Benutzerverwaltung
• Zeitersparnis durch einheitliche Umgebung und vorinstallierte Software
• kurze Reaktionszeit bei Support
• praxisnaher Einsatz
• zeit- und ortsunabhängige Nutzung
• kollaboratives Arbeiten im Team
• Skalierbarkeit der Systemressourcen
• Erweiterbarkeit der Module
• Nachnutzung, Langzeitverfügbarkeit, Forschungsdatenmanagement
IT for All: Digitale Datenanalyse in den
Geschichts- und Kunstwissenschaften
40.
Erfahrungen
•Problembereiche
• leistungsfähige undstörungsfreie Netzanbindung
• lizenzpflichtige Software
• hauptspeicherintensive Software (z.B. Oxygen)
• Anbindung an bestehende Authentifizierungsdienste (LDAP, Shibboleth)
IT for All: Digitale Datenanalyse in den
Geschichts- und Kunstwissenschaften
41.
Erfahrungen
•Bedarf vorhanden
• aktuell38 Labs und 487 User (Lehrende und Studierende)
• IT-for-all DH-Zertifikat in Geschichts- und Kunstwissenschaften
• Einbeziehung von Informatik und Statistik
• Ausweitung auf andere Fachbereiche und Universitäten
•fachnahe Vermittlung von IT-Wissen
• wichtig: Übung und praktische Anwendung
• Präsenzveranstaltungen mit intensiver Individualbetreuung
•praktikabel im Lehr- und Forschungsalltag
IT for All: Digitale Datenanalyse in den
Geschichts- und Kunstwissenschaften
42.
1. Organisatorischer Hintergrund
2.Konzept der Wissensvermittlung
3. Architektur des DHVLab
4. Komponenten des DHVLab
5. Einsatz und Erfahrungen
6. Zukunftsperspektiven
IT for All: Digitale Datenanalyse in den
Geschichts- und Kunstwissenschaften
43.
Zukunftsperspektiven
•Weiterentwicklung zum DHVLabII im Rahmen des DCB
• Nutzungsbedingungen und Zustimmung der Benutzer (Datenschutz)
• Modifizierung der Benutzerverwaltung (1 User – n Labs)
• Integration des Systems „dh-lehre“ im Modul „Dokumentation“
• Zugang: Orientierung an Lehrveranstaltungen (nicht Module)
•Kollaboration
• Sammeln von fachspezifischen Daten
• Sammeln von Werkzeugen zur Analyse und Auswertung
• Aufbau einer Wissensbasis (Daten, Dokumentation und Publikation)
IT for All: Digitale Datenanalyse in den
Geschichts- und Kunstwissenschaften
44.
Zukunftsperspektiven
•Einsatz an mehrerenUniversitäten
• Kooperationsvertrag mit Vereinbarung zu Datenauftragsverarbeitung
(Zuständigkeiten und Verantwortlichkeiten)
•Ressourcen
• Skalierung der Hardware (Server, Storages, Netzanbindung)
• Personal für Weiterentwicklung, Administration, Wartung und Support
IT for All: Digitale Datenanalyse in den
Geschichts- und Kunstwissenschaften
45.
Zukunftsperspektiven
•Geschäftsmodell
• Hosting: zentral(z.B. am LRZ) oder dezentral (an mehreren RZ) ?
• Weiterentwicklung, Administration, Wartung und Support: zentral (ITG)
oder verteilt ?
• Kosten für Hardware und Personal: zentral oder auf Standorte verteilt ?
• Admin-Group / Konsortium ?
IT for All: Digitale Datenanalyse in den
Geschichts- und Kunstwissenschaften
46.
Vielen Dank fürIhre Aufmerksamkeit!
IT for All: Digitale Datenanalyse in den
Geschichts- und Kunstwissenschaften
DHVLab: https://dhvlab.gwi.uni-muenchen.de
Video: https://tinyurl.com/dhvlab2018
Twitter: @dhvlab