Das GIGA hat im Jahr 2013 ein Forschungsdatenmanagement institutionell am GIGA Informationszentrum (IZ) verankert. Das IZ baut seit dem successive Dienstleistungen rund um das Forschungsdatenmanagement aus. Schnell wurde klar, dass eine Vielzahl der am GIGA erstellten Forschungsdaten aus verschiedenen Gründen nicht als "Open Data" veröffentlicht werden können, eine Nachnutzung allerdings durchaus möglich ist. Das IZ hat daher eine Datenbank entwickelt, in denen veröffentlichte und nicht-veröffentlichte Forschungsdaten dokumentiert und auffindbar sind.
Forschungsdatenmanagement am Beispiel des GIGA German Institute of Global and...Jan Lüth
Input zur Diskussion im Rahmen der Mitgliederversammlung des CrossArea - Verband für Transregionale Studien, Vergleichende Area Studies und Global Studies e.V.
KI, Sprachtechnologie und Digital Humanities: Ein (unvollständiger) ÜberblickGeorg Rehm
Georg Rehm. KI, Sprachtechnologie und Digital Humanities: Ein (unvollständiger) Überblick. Interdisziplinärer Forschungsverbund Digital Humanities in Berlin (ifDHb), 23. Berliner DH-Rundgang im Deutschen Forschungszentrum für Künstliche Intelligenz, Berlin, Germany, February 05, 2018.
Forschungsdatenmanagement in den (vergleichenden) Regionalwissenschaften - am...Jan Lüth
In 2014 wurden ein institutionelles Forschungsdatenmanagement im Aufgabenspektrum des GIGA Informationszentrums (IZ) zu verankern. Im Vortrag wird der Forschungsdaten-Service des IZ vorgestellt.
Forschungsdatenmanagement am Beispiel des GIGA German Institute of Global and...Jan Lüth
Input zur Diskussion im Rahmen der Mitgliederversammlung des CrossArea - Verband für Transregionale Studien, Vergleichende Area Studies und Global Studies e.V.
KI, Sprachtechnologie und Digital Humanities: Ein (unvollständiger) ÜberblickGeorg Rehm
Georg Rehm. KI, Sprachtechnologie und Digital Humanities: Ein (unvollständiger) Überblick. Interdisziplinärer Forschungsverbund Digital Humanities in Berlin (ifDHb), 23. Berliner DH-Rundgang im Deutschen Forschungszentrum für Künstliche Intelligenz, Berlin, Germany, February 05, 2018.
Forschungsdatenmanagement in den (vergleichenden) Regionalwissenschaften - am...Jan Lüth
In 2014 wurden ein institutionelles Forschungsdatenmanagement im Aufgabenspektrum des GIGA Informationszentrums (IZ) zu verankern. Im Vortrag wird der Forschungsdaten-Service des IZ vorgestellt.
Günther, A. (2011, Januar).
Forschungsdatenmanagement in der Psychologie: Rahmenbedingungen, Ansätze, Perspektiven. (PDF) 5. Konferenz für Sozial- und Wirtschaftsdaten, Wiesbaden.
Workshop für die LUH: ForschungsdatenmanagementFrauke Ziedorn
Eine Einführung ins Forschungsdatenmanagement:
Was sind eigentlich Forschungsdaten?
Was sind Metadaten?
Erste Schritte zu Datenmanagementplänen.
Wo kann ich meine Daten ablegen?
Einführung Linked Open Data (LOD) - Introduction to Linked Open Data (LOD)Martin Kaltenböck
Präsentation von Martin Kaltenböck (SWC) bei den Wissenschaftstagen der Akademie der Wissenschaften am 3.12. 2014 zum Thema - Einführung, Basis und Benefits von Linked Open Data (LOD) inkl. Best Practise: Linked Open Data Pilot Österreich (LOD Pilot AT - http://linkeddata.gv.at).
Forschungsdaten zwischen "dunkler" Archivierung und Open DataETH-Bibliothek
Vortrag am 104. Deutschen Bibliothekartag.
Gliederung:
- Ausgangslage
- Verhältnis von Offenheit und langfristiger Erhaltung
- Anwendungsfälle
- Schlussforlgerungen für Dienstleistungen
Digitale Methoden in den Sozial- und Geisteswissenschaften: Chancen und Herau...Cornelius Puschmann
Held on December 17th, 2012, as part of the Göttingen Center for Digital Humanities' lecture series on Internet and society. My thanks to Heidi Hanekop for the kind invitation.
http://www.gcdh.de/en/events/calendar-view/dr.-cornelius-puschmann-digitale-methoden-in-den-sozial-und-geisteswissenschaften-chancen-und-herausforderungen
Zusätzlich zu konventionellen Recherchemethoden
im Internet
auf die Arbeit anderer aufzubauen
und mit Ihnen zusammenzuarbeiten
um umfassender informiert zu sein
und (nebenbei) selber wahrgenommen zu werden.
Günther, A. (2011, Januar).
Forschungsdatenmanagement in der Psychologie: Rahmenbedingungen, Ansätze, Perspektiven. (PDF) 5. Konferenz für Sozial- und Wirtschaftsdaten, Wiesbaden.
Workshop für die LUH: ForschungsdatenmanagementFrauke Ziedorn
Eine Einführung ins Forschungsdatenmanagement:
Was sind eigentlich Forschungsdaten?
Was sind Metadaten?
Erste Schritte zu Datenmanagementplänen.
Wo kann ich meine Daten ablegen?
Einführung Linked Open Data (LOD) - Introduction to Linked Open Data (LOD)Martin Kaltenböck
Präsentation von Martin Kaltenböck (SWC) bei den Wissenschaftstagen der Akademie der Wissenschaften am 3.12. 2014 zum Thema - Einführung, Basis und Benefits von Linked Open Data (LOD) inkl. Best Practise: Linked Open Data Pilot Österreich (LOD Pilot AT - http://linkeddata.gv.at).
Forschungsdaten zwischen "dunkler" Archivierung und Open DataETH-Bibliothek
Vortrag am 104. Deutschen Bibliothekartag.
Gliederung:
- Ausgangslage
- Verhältnis von Offenheit und langfristiger Erhaltung
- Anwendungsfälle
- Schlussforlgerungen für Dienstleistungen
Digitale Methoden in den Sozial- und Geisteswissenschaften: Chancen und Herau...Cornelius Puschmann
Held on December 17th, 2012, as part of the Göttingen Center for Digital Humanities' lecture series on Internet and society. My thanks to Heidi Hanekop for the kind invitation.
http://www.gcdh.de/en/events/calendar-view/dr.-cornelius-puschmann-digitale-methoden-in-den-sozial-und-geisteswissenschaften-chancen-und-herausforderungen
Zusätzlich zu konventionellen Recherchemethoden
im Internet
auf die Arbeit anderer aufzubauen
und mit Ihnen zusammenzuarbeiten
um umfassender informiert zu sein
und (nebenbei) selber wahrgenommen zu werden.
Forschungsergebnisse dauerhaft zugänglich machen - Strategien und Erfahrunge...
Die GIGA Forschungsdaten-Datenbank - Nachnutzung von Forschungsdaten durch Sichtbarkeit ermöglichen
1. Die GIGA Forschungsdaten-Datenbank
Nachnutzung von Forschungsdaten durch Sichtbarkeit ermöglichen
Jan Lüth
GIGA German Institute of Global and Area Studies
Leibniz-Institut für Globale und Regionale Studien
VDB-Fortbildungsveranstaltung "Das Koloniale und das
Digitale" - Bibliothekarische Betreuung ethnologischer
Sammlungen und Institute
29. - 30. November 2018, in Hamburg
https://creativecommons.org/licenses/by/4.0/
3. Forschung am GIGA / Regionen / Regionalinstitute
3Karte: Lüth, CC BY, basierend auf : https://commons.wikimedia.org/wiki/File:BlankMap-FlatWorld6.svg
4. • Politische Verantwortlichkeit und
Partizipation
• Frieden und Sicherheit
• Wachstum und Entwicklung
• Macht und Ideen
Forschung am GIGA / Forschungsschwerpunkte
4
6. • 59% Qualitative Daten
(Transkripte, Audio-, Video-Dateien etc.)
• 41% Quantitative Daten
(Survey-Daten, Datenbanken etc.)
• Sensible Daten
(Herkunft: 15%, Inhalt: 56%)
• 41% problemlos zu veröffentlichen –
59% unklar oder nicht zu veröffentlichen
Forschungsdaten am GIGA / Standortbestimmung
6Quelle: Interne Befragung, GIGA IZ 2014, n=41
7. • Regeln guter wissenschaftlichen Praxis
• Wissenstransfer: Leibniz-Grundsatz: „Theoria cum Praxi“
Wissenschaft zum Wohl und Nutzen des Menschen
• Forschen über Regionen, in den Regionen,
Forschen mit Menschen in den Regionen
• Strategisches Ziel: Forschungsergebnisse, wann
immer möglich, kostenlos zugänglich und nutzbar zu
machen
• …
• Institutionelles Forschungsdatenmanagement seit 2014
FDM / GIGA / Motivation / Strategie
7DFG - Sicherung guter wissenschaftlicher Praxis http://doi.org/10.1002/9783527679188.oth1, Fünf Punkte der Leibniz-
Strategie 2020 https://www.leibniz-gemeinschaft.de/fileadmin/user_upload/downloads/Presse/Publikationen/Leibniz-
11. Open Access / Open Data
• Metadaten voll offengelegt, Daten zugänglich (Download)
• Präferierte Option für nicht-sensible Daten
Mediated Access
• Metadaten voll offengelegt, „Vermittelter“ Zugang
• Gute Option für sensible und / oder vertrauliche Daten
Restricted Access
• Zugang zu (sensiblen) Daten in Einzelfällen unter
besonderen Vorkehrungen, Existenz offengelegt (Paper)
Closed Access
• Zugang zu (hochsensiblen) Daten nicht verfügbar für
Dritte, Existenz nicht offengelegt
GIGA Forschungsdaten-Service / Beratung
Datenveröffentlichung
11Grafik: Birte Pfeiffer in Anlehnung an: http://libguides.library.curtin.edu.au/c.php?g=202401&p=1333346/, Zugriff: 09/2018,
Gelbes Icon von Freepik, https://www.flaticon.com
12. Forschungsdaten-Datenbank - Ziele
• Forschungsdaten als Forschungsergebnisse sichtbar machen,
unabhängig vom Zugangsweg
• Nachnutzung und Kollaboration ermöglichen
• Bidirektionale Verknüpfung mit anderen Entitäten der Forschung am
GIGA
• Wissenschaftlerinnen
• Forschungsprojekte
• Forschungsregionen, Forschungsschwerpunkte
• Veröffentlichungen
• Medienbeiträge
• Direkter Zugriff / Verlinkung bei Open Data
12
13. Forschungsdaten-Datenbank
• Datenbank als Nachweisinstrument ≠ Repositorium
• Erfassung in Webformular
• Datenhaltung im Web-CMS
• Verknüpfung im Web-CMS durch
Forschungsdatenmanagerin
13
14. Datenerfassung / Metadaten
1. What is the name/title of the data collection?
2. Is the data in the collection newly generated, has it been
sourced from elsewhere, or both?
3. Is the data associated with a specific research or dissertation
project?
4. Who collected the data?
5. Please specify to which subject your dataset can be attributed.
6. Please describe your dataset!
7. Please describe the procedure, technique, or mode of inquiry
used to attain the data.
14
15. Datenerfassung / Metadaten
8. Please describe the time dimension of the data collection.
9. Please specify the temporal coverage of your dataset.
10. Please describe the unit of analysis in your dataset.
11. What is the number of units in the dataset?
12. Please describe the spatial coverage of your data set.
13. What format is your data collected in?
14. Please list all supplementary files that are mandatory to
understand the dataset.
15. Please specify any related resources to the dataset.
15
16. Datenerfassung / Metadaten
16. Has the data itself been already published or shared
through a repository or through a journal?
16a. Do you wish to publish and share your data set in a
repository to get a DOI?
16b. Do you agree that we save the metadata of your
research data collected in this survey in the GIGA Research-
Data-Database?
16c. Would you like to get support from the GIGA Information
Centre with data sharing?
16
17. Datenerfassung / Metadaten
17. Has the process for generating the data in the collection
undergone GIGA’s ethics committee approval?
18. Did you request participants’ consent to share “de-
sensitised” data before you collected it?
19. Are there any specific ethics, legal or copyright
considerations about providing access to the data collection?
20. Would you provide conditional access to your
sensitive/confidential data (e.g. research stay at GIGA)?
21. Can the data be anonymised to protect people’s identities
before the data collection is shared?
17
27. • FAIR Guiding Principles for scientific data management
and stewardship
• Findable, Accessible, Interoperable, Re-usable
• Forschungsdaten und Metadaten … für Menschen und
Maschinen
• Auffindbar
• Zugänglich
• Interoperabel
• Wiederverwendbar
FAIR Principles / GO FAIR Initiative
27FAIR principles http://www.go-fair.org/fair-principles/
28. Findable
• F1. (Meta)data are assigned a globally unique and persistent
identifier
• F2. Data are described with rich metadata
• F3. Metadata clearly and explicitly include the identifier of the data
they describe
• F4. (Meta)data are registered or indexed in a searchable resource
28
29. Accessible
• A1. (Meta)data are retrievable by their identifier using a
standardised communications protocol
• A1.1 The protocol is open, free, and universally implementable
• A1.2 The protocol allows for an authentication and authorisation
procedure, where necessary
• A2. Metadata are accessible, even when the data are no longer
available
29
30. Interoperable
• I1. (Meta)data use a formal, accessible, shared, and broadly
applicable language for knowledge representation.
• I2. (Meta)data use vocabularies that follow FAIR principles
• I3. (Meta)data include qualified references to other (meta)data
30
31. Reusable
• R1. Meta(data) are richly described with a plurality of accurate and
relevant attributes
• R1.1. (Meta)data are released with a clear and accessible data
usage license
• R1.2. (Meta)data are associated with detailed provenance
• R1.3. (Meta)data meet domain-relevant community standards
Details siehe: https://www.go-fair.org/fair-principles/
31
32. Ausblick / Forschungsdaten-Datenbank
• Erfassung weiterer Forschungsdaten
• Retrospektiv: Analyse von Publikationen hinsichtlich
Datengrundlage
• Laufend: Beratung in der Projektantragsphase
• Desiderate
• Implementierung im Forschungsinformationssystem
• CMS als Insel (Web-Suchmaschinen vs. Wiss.
Suchmaschinen)
• Anforderungen der FAIR Principles
• Sichtbarmachung und Vernetzung über FAIR-konforme
Infrastrukturen
32
33. Vielen Dank für Ihre Aufmerksamkeit
Jan Lüth, GIGA Informationszentrum / Leiter
Dr. Birte Pfeiffer, GIGA Informationszentrum / Forschungsdatenmanagement
Kontakt: research-data@giga-hamburg.de
Website: GIGA Forschungsdaten-Datenbank
33
Hinweis der Redaktion
Unter Verwendung unterschiedlicher Forschungsmethoden werden entsprechend Forschungsdaten generiert, die klassisch zu charakterisieren wären als qualitative und quantitative Daten.
59 % Qualitative Daten wie Interview-Transkripte, Audio- und Video-Dateien, Fotos, die während Feldforschungsaufenthalten in den Forschungsregionen erhoben werden.
41 % Quantitative Daten wie Survey-Daten z.B. von Haushalten oder Kleinstunternehmern in einzelnen Ländern oder Regionen, Datenbanken, etc.
Starke Intrinsische Motivation auf Grund des Forschungsgegenstands aber auch Hemmnisse: Aufwände? Kompetitive Forschung Fehlende Anreize?
Warum Forschungsdatenmanagement?
Grundlegende Elemente unseres Handelns….
Regeln guter Wissenschaftlicher PraxisEmpfehlungen der Deutschen Forschungsgemeinschaft (DFG), Empfehlung 7: "Primärdaten als Grundlagen für Veröffentlichungen auf haltbaren und gesicherten Trägern in der Institution, wo sie entstanden sind, zehn Jahre lang aufbewahrt werden"
In 2013 wurden im IZ begonnen ein institutionelles Forschungsdatenmanagement im Aufgabenspektrum zu verankern. Seit 2014 wird dies durch eine Person (50% Stelle) betreut. Zunächst erfolgte eine Standortbestimmung durch eine interne Befragung sowie persönliche Gespräche und Interviews, u.a. durch Beteiligung an dem Projekt SowiDataNet im Rahmen der Anforderungserhebung an ein Repositorium für quantitative Daten. Es wurden dann erste quantitative Datensätze veröffentlicht.
Nach zwei Personalwechseln ist die Stelle seit Mitte 2016 mit Dr. Birte Pfeiffer besetzt. Die wesentlichen Aspekte des FDService sind
Die Erarbeitung einer institutionellen FD-Policy
Beratung und Unterstützung der WissenschaftlerInnen über den gesamten Forschungszyklus
Die Kuration, Dokumentation und Veröffentlichung von Forschungsdaten und die Sicherstellung ihrer Archivierung
Fortbildung und Training der Wissenschaftler
Schwerpunkt liegt derzeit auf der Beratung bei der Projektantragsstellung:
Hintergrund dieser Beratung ist, dass Forschungsförderer wie die DFG und die EU (Horizon2020) zunehmend Angaben zum FDM in Projektanträgen verlangen.
Verlangt werden allgemein eine Auseinandersetzung mit den folgenden Themen:
Art der erhobenen Daten, Relevanz für andere Forschungskontexte
Organisation und Qualitätssicherung der Daten
Sicherstellung der Auffindbarkeit und Nachnutzbarkeit der Daten
Datenspeicherung und Backups
Klärung ethischer Aspekte
Klärung von (lizenz-)rechtlichen Fragen
Veröffentlichung und Archivierung der Daten
Anforderungen sind besonders hoch, wenn es um sensible, personenbezoigene Daten geht
Ethische Aspekte bei der Datenerhebung in den Regionen
Speicherung und Übertragung sensibler FD
und der Veröffentlichung von FD
Bereits in der Antragsphase sind Überlegungen zum Umgang mit Forschungsdaten zu treffen, die über die Projektphase hinausgehen. Am GIGA konnten bereits eine Anzahl von Daten problemlos veröffentlicht werden. Bei Fragen einer möglichen Veröffentlichung der Daten gilt es diesbezügliche Restriktionen und Anforderungen zu betrachten. Das sind Fragen wie erforderliche Anonymisierung, mögliche Embargo-Zeiten einer Veröffentlichung oder die Wahl eines geeigneten Repositoriums.
Quantitative Daten wurden bisher im GESIS datorium, zukünftig im GESIS SowiDataNet veröffentlicht. Über die Beratung hinaus wird dabei durch das IZ in Abstimmung mit den Wissenschaftlerinnen die geeignete Datenformate gewählt, umfassende Dokumentation erstellt, Metadaten erstellt und die eigentliche Datenveröffentlichung vorgenommen.
Bei qualitativen Interviewdaten streben wir die Veröffentlichung / Archivierung im Repositorium Quali-Service der Universität Bremen an.
Die Datenveröffentlichung folgt dem Paradigma "as open as possible, as closed as necessary!“. Es kann und muss nicht immer Open Data sein. So kann der Zugang zu Daten differenzierter betrachtet warden
Open Access / Open Data
Mediated Access
Daten, die prinzipiell für eine Nachnutzung – in Rücksprache – möglich ist, durchaus Off-Site
Restricted Access
Sensible Daten, deren Existenz z.B. durch einen Aufsatz oder durch Metadaten offen gelegt ist
Eine Nachnutzung erfolgt allenfalls in Einzelfällen unter besonderen Vorkehungen, z.B. On-Site Nutzung vor Ort
Closed Access
Hochsensible Daten, deren Existenz nicht offengelegt wird
Mit Blick auf die eben genannte Differenzierung ist es Notwendig für eine Sichtbarkeit der Forschungsdaten zu sorgen, die nicht als Open Data veröffentlicht werden können.
Pfadabhängigkeit Web-CMS
Von 20 Datensätzen sind 13 veröffentlicht, 3 Mediated Access, 4 Restricted Access
Ersterhebung erfolgte über eine interne Befragung. Die Wissenschaftlerinnen gaben die Metadaten direkt in das Formular ein. Die Forschungsdatenmanagerin überarbeitete die Metadaten und nahm die Verknüpfungen innerhalb der Website vor.
Eine Recherche in der Datenbank ist möglich. Noch ist die Datenbank überschaubar, mit steigender Anzahl von Datensätzen wird auch die Suche wichtiger.
Such- bzw. Filter-Interface
Die vorhandenen Metadaten ermöglichen nicht nur eine Suche in der Datenbank sondern erlaubt auch Verknüpfungen der nachgewiesnen Datensätze mit den verantwortlichen Wissenschaftlerinnen, zugehörigen Veröffentlichungen, Projekten und Medienbeiträgen.
Hier Beschreibung der Forschungsdaten
Wie kann der Zugang zum Datensatz erfolgen?
Wie kann der Zugang zum Datensatz erfolgen?
Ich möchte zu den Desideraten kommen und dazu einmal auf die FAIR Principles verweisen. Diese formulieren Grundsätze, die Nachnutzbarkeit von Forschungsdaten und Nachhaltigkeit entsprechender Forschungsdateninfrastrukturen in den Mittelpunkt stellen.
Daten und Metadaten einfach auffindbar
Daten und Metadaten sind einfach zugänglich, Angaben zu Nutzungs- und Zugangsbedingungen sind verfügbar
Daten sind interoperabel, Dafür Entwicklung und Anwendung von erforderlichen Standards für Austausch, Speicherung, Analyse und Verarbeitung
Daten und Metadaten sind wiederverwendbar. Das setzt beispielsweise eine gute Dokumentation voraus.
FAIR Principles
Findable
Nur Web-Suchmaschinen
Accessible
Maschinenlesbarkeit?
Interoperabel
(Meta)data include qualified references to other (meta)data URLs! , Thesaurus?
Reuseable
(Meta)data meet domain-relevant community standards Wer definiert diese?
Wie lösen wir uns von unserer Website-Insel?
Wie erreichen wir eine Sichtbarkeit der Metadaten in Wissenschaftlichen Suchmaschinen?
Wie erreichen wir eine Verknüpfung der Daten mit Entitäten/Artefakten im WWW bzw. wissenschaftlichen Umgebungen?