Vortrag am 104. Deutschen Bibliothekartag.
Gliederung:
- Ausgangslage
- Verhältnis von Offenheit und langfristiger Erhaltung
- Anwendungsfälle
- Schlussforlgerungen für Dienstleistungen
Workshop für die LUH: ForschungsdatenmanagementFrauke Ziedorn
Eine Einführung ins Forschungsdatenmanagement:
Was sind eigentlich Forschungsdaten?
Was sind Metadaten?
Erste Schritte zu Datenmanagementplänen.
Wo kann ich meine Daten ablegen?
Modernes Datenmanagement: Linked Open Data und die offene BibliothekJens Mittelbach
Fachsymposium zum Campus-Kick-Off der Hochschule der Medien, Stuttgart, 12/2014: Forschung für die Praxis -
Perspektiven für Bibliotheks- und Informationsmanagement
Open Science - Freie Wissenschaft für eine freie GesellschaftStefan Kasberger
Präsentation zu Open Science mit Open Data, Open Access, Open Peer Review, Open Source, Open Methodology und Open Educational Resources. Weiters gibt es einen Überbick über Aktivitäten international und in Österreich.
Veranstaltung: Open Commons Kongress 2013 in Linz.
Video: https://www.dorftv.at/video/7150
Blog: http://openscienceasap.org/stream/2013/07/12/open-science-praesentation-am-open-commons-kongress-2013/
Leitbild Openness - Bibliotheken als Wächter für den (dauerhaft) freien Zugan...Felix Lohmeier
Wozu brauchen wir noch wissenschaftliche Bibliotheken, wenn alle Forschungsergebnisse kostenfrei und öffentlich verfügbar sind (100% Open Access), zu allen Forschungsthemen kostenfreie Kurse der Ivy League abrufbar sind (100% MOOCs) und mir Peers in akademischen Communities zu allen Spezialfragen sofort weiterhelfen (100% Follower-Power)? In aktuellen Debatten zur Perspektive von (wissenschaftlichen) Bibliotheken verweisen die meisten Strategien auf die Bibliothek als Raum und Treffpunkt, neue Multimedia-Angebote und neue Aufgaben im Forschungsdatenmanagement. Das reicht als kurzfristige Überlebensstrategie, folgt aber keiner größeren Vision für die zukünftige Rolle von Bibliotheken. Dabei ist spätestens mit dem "Ende der Gratiskultur", welche die Medienkonzerne 2010 eingeläutet haben, und der Erkenntnis, dass ein Weltkonzern wie Google dem Motto "Don't be evil" nicht gerecht werden kann, das Spielfeld für Bibliotheken im Internet ganz neu eröffnet. Es zeigt die tiefe Resignation der Bibliotheksbranche, wenn Oligopole für Wissenschaftsevaluation (Impact Factor), Preisdiktate von großen Zeitschriftenverlagen, DRM-Einschränkungen bei eBooks und langfristige Abhängigkeiten von kommerziellen Bibliotheksdienstleistern hingenommen werden. Der freie Zugang zum Wissen unterliegt ständigen Gefährdungen und Bedrohungen, die von Marktinteressen und Nutzerdesinteresse ausgehen. Funktioniert der Markt nach den Prinzipien der Openness (wofür es durchaus wirtschaftliche Anreize gibt), sollten Bibliotheken nicht im Wege stehen. Ist jedoch die Openness der Angebote gefährdet, lohnt es einzugreifen und selbst Dienste aufzubauen, bis die Openness wiederhergestellt ist. Daher plädiere ich in diesem Vortrag für eine Positionierung der Bibliotheken als Wächter für den (dauerhaft) freien Zugang zum Wissen. Angewandt auf die heutige Zeit erfordert dies eine konsequente Ausrichtung des eigenen Handelns an den Prinzipien von Open Science und Open Data.
Generische Datenintegration zur semantischen Diagnoseunterstützung im Projekt...Florian Stegmaier
Derzeitig basiert der diagnostische Prozess eines Krankheitsverlaufes in Krankenhäusern auf einer manuellen Beurteilung von Patientendaten zu unterschiedlichen Zeiten und unterschiedlichen Modalitäten (z. B. CT-Aufnahmen vs. MRT). Diese Aufnahmen werden in sehr großen Datenarchiven (Picture Archiving and Communication System, PACS) gespeichert, wohingegen einzelne Datensätze aufgrund von fehlenden aussagekräftigen semantischen Annotationen nur bedingt effizient angefragt werden können.
In dieser Präsentation wird ein generischer Ansatz vorgestellt, um die heterogenen Kliniksysteme durch moderne, semantisch aussagekräftige Technologien zu verbinden und uniform anfragbar zu machen. Durch einen uniformen Zugriff bezüglich Speicherungsform und Anfrageparadigma wird auf diese heterogene Datenlandschaft eine hochwertige semantische Diagnoseunterstützung ermöglicht.
Workshop für die LUH: ForschungsdatenmanagementFrauke Ziedorn
Eine Einführung ins Forschungsdatenmanagement:
Was sind eigentlich Forschungsdaten?
Was sind Metadaten?
Erste Schritte zu Datenmanagementplänen.
Wo kann ich meine Daten ablegen?
Modernes Datenmanagement: Linked Open Data und die offene BibliothekJens Mittelbach
Fachsymposium zum Campus-Kick-Off der Hochschule der Medien, Stuttgart, 12/2014: Forschung für die Praxis -
Perspektiven für Bibliotheks- und Informationsmanagement
Open Science - Freie Wissenschaft für eine freie GesellschaftStefan Kasberger
Präsentation zu Open Science mit Open Data, Open Access, Open Peer Review, Open Source, Open Methodology und Open Educational Resources. Weiters gibt es einen Überbick über Aktivitäten international und in Österreich.
Veranstaltung: Open Commons Kongress 2013 in Linz.
Video: https://www.dorftv.at/video/7150
Blog: http://openscienceasap.org/stream/2013/07/12/open-science-praesentation-am-open-commons-kongress-2013/
Leitbild Openness - Bibliotheken als Wächter für den (dauerhaft) freien Zugan...Felix Lohmeier
Wozu brauchen wir noch wissenschaftliche Bibliotheken, wenn alle Forschungsergebnisse kostenfrei und öffentlich verfügbar sind (100% Open Access), zu allen Forschungsthemen kostenfreie Kurse der Ivy League abrufbar sind (100% MOOCs) und mir Peers in akademischen Communities zu allen Spezialfragen sofort weiterhelfen (100% Follower-Power)? In aktuellen Debatten zur Perspektive von (wissenschaftlichen) Bibliotheken verweisen die meisten Strategien auf die Bibliothek als Raum und Treffpunkt, neue Multimedia-Angebote und neue Aufgaben im Forschungsdatenmanagement. Das reicht als kurzfristige Überlebensstrategie, folgt aber keiner größeren Vision für die zukünftige Rolle von Bibliotheken. Dabei ist spätestens mit dem "Ende der Gratiskultur", welche die Medienkonzerne 2010 eingeläutet haben, und der Erkenntnis, dass ein Weltkonzern wie Google dem Motto "Don't be evil" nicht gerecht werden kann, das Spielfeld für Bibliotheken im Internet ganz neu eröffnet. Es zeigt die tiefe Resignation der Bibliotheksbranche, wenn Oligopole für Wissenschaftsevaluation (Impact Factor), Preisdiktate von großen Zeitschriftenverlagen, DRM-Einschränkungen bei eBooks und langfristige Abhängigkeiten von kommerziellen Bibliotheksdienstleistern hingenommen werden. Der freie Zugang zum Wissen unterliegt ständigen Gefährdungen und Bedrohungen, die von Marktinteressen und Nutzerdesinteresse ausgehen. Funktioniert der Markt nach den Prinzipien der Openness (wofür es durchaus wirtschaftliche Anreize gibt), sollten Bibliotheken nicht im Wege stehen. Ist jedoch die Openness der Angebote gefährdet, lohnt es einzugreifen und selbst Dienste aufzubauen, bis die Openness wiederhergestellt ist. Daher plädiere ich in diesem Vortrag für eine Positionierung der Bibliotheken als Wächter für den (dauerhaft) freien Zugang zum Wissen. Angewandt auf die heutige Zeit erfordert dies eine konsequente Ausrichtung des eigenen Handelns an den Prinzipien von Open Science und Open Data.
Generische Datenintegration zur semantischen Diagnoseunterstützung im Projekt...Florian Stegmaier
Derzeitig basiert der diagnostische Prozess eines Krankheitsverlaufes in Krankenhäusern auf einer manuellen Beurteilung von Patientendaten zu unterschiedlichen Zeiten und unterschiedlichen Modalitäten (z. B. CT-Aufnahmen vs. MRT). Diese Aufnahmen werden in sehr großen Datenarchiven (Picture Archiving and Communication System, PACS) gespeichert, wohingegen einzelne Datensätze aufgrund von fehlenden aussagekräftigen semantischen Annotationen nur bedingt effizient angefragt werden können.
In dieser Präsentation wird ein generischer Ansatz vorgestellt, um die heterogenen Kliniksysteme durch moderne, semantisch aussagekräftige Technologien zu verbinden und uniform anfragbar zu machen. Durch einen uniformen Zugriff bezüglich Speicherungsform und Anfrageparadigma wird auf diese heterogene Datenlandschaft eine hochwertige semantische Diagnoseunterstützung ermöglicht.
Herausforderungen im Datenmanagement von MetadatenETH-Bibliothek
Herausforderungen im Datenmanagement von Metadaten. Datenmanagement wird für viele Organisationen in der Schweiz immer wichtiger. Dabei ist die Bedeutung von Metadaten im Rahmen von Prozessdefinitionen nicht zu unterschätzen. Ohne entsprechende Datendokumentation haben z.B. Forschungsdaten wenig Aussagekraft, die ihre Bedeutung nicht mehr nachvollziehbar ist. Oftmals zwingt dieses Dilemma Mitarbeiter von Forschungsdateneinrichtungen in den Bereich der Nachdokumentation. Dieser Vortrag zeigt die Verwendung von Data Life Cycle Modellen, nennt Beispiele für verschiedene Metadatenstandards und passend dazu der Verwendung von Toolchains zur Datendokumentation.
Einfürung in Open Data und Linked Data im Kontext bibliografische Daten und Bibliotheken. Inklusive einem Szenario für den Einstieg: Erweiterung eines Katalogs oder Dokumentenservers um eine semantische Komponente.
Vortrag im Rahmen der Veranstaltung "Gegenwart und Zukunft der Sacherschließung". Die interdisziplinäre Fortbildung für Fachreferentinnen und Fachreferenten wurde veranstaltet von der Kommission für Fachreferatsarbeit mit Unterstützung der Deutschen Nationalbibliothek in Leipzig und fand am 6. und 7. Oktober 2011 statt.
Enthält Teile von CC Attribution-ShareAlike Vorträgen Anderer. Vielen Dank an dieser Stelle.
Die GIGA Forschungsdaten-Datenbank - Nachnutzung von Forschungsdaten durch Si...Jan Lüth
Das GIGA hat im Jahr 2013 ein Forschungsdatenmanagement institutionell am GIGA Informationszentrum (IZ) verankert. Das IZ baut seit dem successive Dienstleistungen rund um das Forschungsdatenmanagement aus. Schnell wurde klar, dass eine Vielzahl der am GIGA erstellten Forschungsdaten aus verschiedenen Gründen nicht als "Open Data" veröffentlicht werden können, eine Nachnutzung allerdings durchaus möglich ist. Das IZ hat daher eine Datenbank entwickelt, in denen veröffentlichte und nicht-veröffentlichte Forschungsdaten dokumentiert und auffindbar sind.
Wirtschaftswissenschaftliche Forschung replizierbarer machen. Das Projekt EDa...svlaemi
Inhalte der Präsentation
> Zur Replizierbarkeit wirtschaftswissenschaftlicher Forschung
> Vertrauen Sie wirtschaftswissenschaftlicher Forschung?
> Wo liegen die Probleme?
> Das Projekt EDaWaX
> Analysen
> Data Sharing in den Wirtschaftswissenschaften
> Data Policies in Fachzeitschriften
> Forschungsdateninfrastrukturen von Fachzeitschriften
> Die EDaWaX Applikation für Datenarchive von Zeitschriften
17:15 Kolloquium – Donnerstag, 27. Februar 2020 – Das Büro darf nicht nur Mit...ETH-Bibliothek
In Zeiten der Digitalisierung ist es nicht einfach, einen inspirierenden und motivierenden Arbeitsplatz zu kreieren: Papier trifft auf digitale Tools, Funktionen und Organigramme treffen auf interdisziplinäre Fragestellungen. Und was wir in der Kommunikation beobachten, taucht auch in der Arbeitswelt immer mehr auf: Mobile first, Flexibilität auf allen Ebenen. Das verändert die Art und Weise, wie wir zusammenarbeiten. Und auch Mitarbeitende haben neue Ansprüche an die Führung, ihren Arbeitsort, ihre Arbeitszeit.
Eine an die heutigen Ansprüche angepasste moderne Arbeitswelt ist für die Weiterentwicklung des gesamten Unternehmens wichtig, aber auch, um als Arbeitgeber attraktiv zu sein.
Vor einigen Jahren hat die Mobiliar daher work@mobiliar ins Leben gerufen: Work@mobiliar ist mehr als Raumgestaltung. Es beschäftigt sich mit Kultur, Kulturwandel und Mindset. Die Referentin führt in ihrem Vortrag aus, wie die Initiative eingeführt wurde, welche Massnahmen ergriffen wurden und erläutert dies an praktischen Beispielen.
OriginStamp: Trusted Time Stamping via the Bitcoin BlockchainETH-Bibliothek
The document discusses trusted timestamping via the Bitcoin blockchain. It introduces Originstamp, a service that uses the blockchain to prove a data record existed at a certain point in time and has not been manipulated since. A live demo is shown of hashing a document and recording it on the blockchain to establish an immutable timestamp. Potential applications discussed include journalism, research data, insurance, and digital libraries.
Weitere ähnliche Inhalte
Ähnlich wie Forschungsdaten zwischen "dunkler" Archivierung und Open Data
Herausforderungen im Datenmanagement von MetadatenETH-Bibliothek
Herausforderungen im Datenmanagement von Metadaten. Datenmanagement wird für viele Organisationen in der Schweiz immer wichtiger. Dabei ist die Bedeutung von Metadaten im Rahmen von Prozessdefinitionen nicht zu unterschätzen. Ohne entsprechende Datendokumentation haben z.B. Forschungsdaten wenig Aussagekraft, die ihre Bedeutung nicht mehr nachvollziehbar ist. Oftmals zwingt dieses Dilemma Mitarbeiter von Forschungsdateneinrichtungen in den Bereich der Nachdokumentation. Dieser Vortrag zeigt die Verwendung von Data Life Cycle Modellen, nennt Beispiele für verschiedene Metadatenstandards und passend dazu der Verwendung von Toolchains zur Datendokumentation.
Einfürung in Open Data und Linked Data im Kontext bibliografische Daten und Bibliotheken. Inklusive einem Szenario für den Einstieg: Erweiterung eines Katalogs oder Dokumentenservers um eine semantische Komponente.
Vortrag im Rahmen der Veranstaltung "Gegenwart und Zukunft der Sacherschließung". Die interdisziplinäre Fortbildung für Fachreferentinnen und Fachreferenten wurde veranstaltet von der Kommission für Fachreferatsarbeit mit Unterstützung der Deutschen Nationalbibliothek in Leipzig und fand am 6. und 7. Oktober 2011 statt.
Enthält Teile von CC Attribution-ShareAlike Vorträgen Anderer. Vielen Dank an dieser Stelle.
Die GIGA Forschungsdaten-Datenbank - Nachnutzung von Forschungsdaten durch Si...Jan Lüth
Das GIGA hat im Jahr 2013 ein Forschungsdatenmanagement institutionell am GIGA Informationszentrum (IZ) verankert. Das IZ baut seit dem successive Dienstleistungen rund um das Forschungsdatenmanagement aus. Schnell wurde klar, dass eine Vielzahl der am GIGA erstellten Forschungsdaten aus verschiedenen Gründen nicht als "Open Data" veröffentlicht werden können, eine Nachnutzung allerdings durchaus möglich ist. Das IZ hat daher eine Datenbank entwickelt, in denen veröffentlichte und nicht-veröffentlichte Forschungsdaten dokumentiert und auffindbar sind.
Wirtschaftswissenschaftliche Forschung replizierbarer machen. Das Projekt EDa...svlaemi
Inhalte der Präsentation
> Zur Replizierbarkeit wirtschaftswissenschaftlicher Forschung
> Vertrauen Sie wirtschaftswissenschaftlicher Forschung?
> Wo liegen die Probleme?
> Das Projekt EDaWaX
> Analysen
> Data Sharing in den Wirtschaftswissenschaften
> Data Policies in Fachzeitschriften
> Forschungsdateninfrastrukturen von Fachzeitschriften
> Die EDaWaX Applikation für Datenarchive von Zeitschriften
17:15 Kolloquium – Donnerstag, 27. Februar 2020 – Das Büro darf nicht nur Mit...ETH-Bibliothek
In Zeiten der Digitalisierung ist es nicht einfach, einen inspirierenden und motivierenden Arbeitsplatz zu kreieren: Papier trifft auf digitale Tools, Funktionen und Organigramme treffen auf interdisziplinäre Fragestellungen. Und was wir in der Kommunikation beobachten, taucht auch in der Arbeitswelt immer mehr auf: Mobile first, Flexibilität auf allen Ebenen. Das verändert die Art und Weise, wie wir zusammenarbeiten. Und auch Mitarbeitende haben neue Ansprüche an die Führung, ihren Arbeitsort, ihre Arbeitszeit.
Eine an die heutigen Ansprüche angepasste moderne Arbeitswelt ist für die Weiterentwicklung des gesamten Unternehmens wichtig, aber auch, um als Arbeitgeber attraktiv zu sein.
Vor einigen Jahren hat die Mobiliar daher work@mobiliar ins Leben gerufen: Work@mobiliar ist mehr als Raumgestaltung. Es beschäftigt sich mit Kultur, Kulturwandel und Mindset. Die Referentin führt in ihrem Vortrag aus, wie die Initiative eingeführt wurde, welche Massnahmen ergriffen wurden und erläutert dies an praktischen Beispielen.
OriginStamp: Trusted Time Stamping via the Bitcoin BlockchainETH-Bibliothek
The document discusses trusted timestamping via the Bitcoin blockchain. It introduces Originstamp, a service that uses the blockchain to prove a data record existed at a certain point in time and has not been manipulated since. A live demo is shown of hashing a document and recording it on the blockchain to establish an immutable timestamp. Potential applications discussed include journalism, research data, insurance, and digital libraries.
Tracking Citations to Research Software via PIDsETH-Bibliothek
Tracking citations to research software via persistent identifiers is difficult due to dilution of citations over many PIDs assigned to a software package. On top of this, software citations are often consistently being edited out by every actor part of the scholarly communication process such as reference managers, publishers, professors and discovery systems. Thus, the survival rate of a software citation is extremely low in the current scholarly ecosystem. The Sloan-funded Asclepias project is a collaboration between a publisher, discovery system and repository with the goal to promote scientific software into an identifiable, citable, and preservable object. We have built a citation broker that is currently tracking some 6.000 citations to Zenodo DOIs from NASA ADS,
CrossRef and EuropePMC.
Persistent Identifiers for Scientific Data at CSCSETH-Bibliothek
Everyone knows the importance of FAIR data principles, data reuse opportunities and provenance traceability. In this talk, Mario Valle will explore the technical and human, non-technical, prerequisites that make these principles concrete. The Swiss National Supercomputing Centre (CSCS) is supporting Swiss scientists by providing and managing Persistent Identifiers (PIDs) to name scientific data. Besides this base service, the CSCS is also experimenting and collecting use cases to make this deceptive simple thing, the PID string, a tool that could help speed up science in Switzerland.
Building Open Research Infrastructure with PIDsETH-Bibliothek
Learn more about ORCID, how it enables connections between persistent identifiers to increase transparency and trust in research information and how to get involved.
DataCite and its Members: Connecting Research and Identifying KnowledgeETH-Bibliothek
PIDs and their metadata support scholarly research and its increasing amounts and
variety of scholarly output. DataCite provides services which enable the research community to identify, connect, cite and track these outputs, making content FAIR. New
services include data level metrics and the use of identifiers for organizations and new
types of content, e.g. software, repositories and instruments. As an open, collaborative
and community driven membership organization we rely on our members for their
input and experience to build services that are beneficial for the research community
as a whole. DataCite services as well as current and future initiatives will be described
and it will be shown how members can contribute and benefit. Over the course of the
years, our membership has grown and diversified and we are therefore refreshing and
clarifying our member model. The new member model will be presented and described.
Bilder online recherchieren – Tipps und TricksETH-Bibliothek
Über die Google Bildersuche zur Bilddatenbank des Bildarchivs der ETH-Bibliothek (E-Pics Bildarchiv Online), allgemeine Suchstrategien, thematische Suche und Ähnlichkeitssuche,
Nutzung und Bildrechte, weitere Datenbanken für Bildmaterialien
Transkribus. Eine Forschungsplattform für die automatisierte Digitalisierung,...ETH-Bibliothek
War es bis vor wenigen Jahren unvorstellbar, dass historische Handschriften automatisiert texterkannt werden können, so haben maschinenlernende Verfahren nunmehr den Durchbruch gebracht. Ob mittelalterlicher Codices oder frühneuzeitliche Handschrift, ob Arabisch, Hebraeisch oder Bangla - mit einigen Dutzend Seiten können die zugrundeliegenden neuronalen Netze so trainiert werden, dass die Transkription für die weitere Verarbeitung brauchbar ist. Um die Technologie einem großen Kreis an Nutzerinnen und Nutzern verfügbar zu machen, wurde im Rahmen zweier EU Projekte die Froschungsplattform Transkribus entwickelt. Mit Transkribus erhalten Nutzerinnen und Nutzer ein Werkzeug, mit dem sie selbst alle Schritte im Workflow abdecken können. Mehr als 18.000 Benutzer haben sich in der Plattform bereits registriert und vielfach das Programm ausprobiert. Der Vortrag wird anhand konkreter Beispiele die Leistungsfähigkeit moderner Texterkennungsverfahren geben, sowie einen Ausblick auf die künftigen Entwicklungen bieten.
Gamification und Game Design: Theorie und Praxis jenseits der Heilsversprechu...ETH-Bibliothek
Gamification bedeutet die Übertragung spielbasierter Elemente auf ursprünglich spielfremde Kontexte. Damit soll die Motivation der Anwender verstärkt werden, um gestellte Aufgaben leichter lösen zu können. Gamification-Szenarien verwenden in der Regel nur einzelne Elemente von Spielsystemen. Davon grenzen sich Serious Games («angewandte Spiele») ab, die über ausgefeilte Spielmechaniken verfügen und die Spielenden umfassender zu engagieren vermögen.
Diese Entwicklungen sind nicht neu, aber das «Heilsversprechen» digitaler Spiele für seriöse oder angewandte Kontexte sind tief in die Gesellschaft diffundiert. Die beiden Referenten zeigen auf, welche theoretischen Grundlagen hinter diesen Spielphänomenen stecken, was bei der Entwicklung bedacht werden muss und wie mit diesen Grundlagen, über den Magic Circle der Games hinaus, auch kulturelle und gesellschaftliche Entwicklungen erklärt werden können. Die Fragen werden anhand von konkreten Beispielen aus Projekten in der Therapie, Forschung und Entwicklungshilfe erörtert.
Presentations, exercises and discussion of the following topics:
- General requirements of research Data management
- Guidelines and responsibilities
- Data management plans (DMP) for the Swiss national Science Foundation (SNSF)
- Data management in practice
- Prerequisites for re-use
- Useful services and tools
- Exchange of experiences, methods and tools
Openness, exchange, FAIR DATA – oh brave new world that has such vision! (Dr....ETH-Bibliothek
Openness, exchange, FAIR data - oh brave new world. For some researchers, this is no longer a vision but already their day-to-day reality. For many others, however, terms like ‘open’, ‘FAIR data’* or ‘data exchange’ pose a challenge. What contribution can we make to ensure that new data comply with the FAIR Data Principles, and how can we measure the FAIRness of existing data? “Trust” is a key aspect: Trust that others interpret ‘your’ data correctly for example, or trust in data repositories.
Digitaler Zugang zu Lesespuren - Das Projekt „Thomas Mann Nachlassbibliothek“...ETH-Bibliothek
Präsentation am Deutschen Bibliothekartag, Juni 2018
1. Das Thomas-Mann-Archiv der ETH Zürich und das Projekt «Thomas Mann Nachlassbibliothek»
Katrin Keller
2. Technische Umsetzung des Projekts
Michael Ehrismann
„Ex meis libris“ - Die Provenienzdatenbank der ETH-Bibliothek ETH-Bibliothek
Präsentation am Deutschen Bibliothekartag, Juni 2018
ETH-Bibliothek: Kurze Geschichte
Die Plattform e-rara.ch
E-Pics: Die Plattform für Bilder und Illustrationen
E-Pics: Alte und Seltene Drucke
E-Pics: Die Provenienzdatenbank
Forschungsdaten zwischen "dunkler" Archivierung und Open Data
1. ||
104. Deutscher Bibliothekartag
Nürnberg, 26. Juni 2015
Dr. Matthias Töwe, ETH-Bibliothek, ETH Zurich
26.05.2015
Forschungsdaten zwischen
«dunkler» Archivierung und Open Data
Matthias Töwe 1
2. ||
Ausgangslage
Verhältnis von Offenheit und langfristiger Erhaltung
Anwendungsfälle
Schlussfolgerungen für Dienstleistungen
26.05.2015
Gliederung
Matthias Töwe 2
3. ||
Forderungen
(Förderer, Politik, Hochschulen, Herausgeber, z.T. Forschende)
Möglichst freier Zugang zu Forschungsdaten
Möglichst unbeschränkte Nutzbarkeit von Forschungsdaten
Mittelfristige Aufbewahrung für die unmittelbare Überprüfbarkeit
Langfristige Aufbewahrung von nicht wieder zu gewinnenden Daten
Erhaltung publizierter Daten analog zu anderen Veröffentlichungen
Ausrichtung Dienstleistung ETH Data Archive
Langzeitarchivierung und Zugänglichkeit von statischen Daten
Also alles ok?
26.05.2015
Ausgangslage
Matthias Töwe 3
4. || 26.05.2015Matthias Töwe 4
Offenheit und Langzeitarchivierung
Daten erhalten, aber für Dritte nicht zugänglich
nur für die Produzenten von Nutzen
Daten erhalten und zugänglich, aber ohne Kontextdokumentation
Nutzung u.U. selbst für die ursprünglichen Produzenten schwierig
Daten werden zugänglich gemacht, aber nicht erhalten
Nicht zitierbar, nicht verlässlich nachnutzbar
Zugänglichkeit und dauerhafte Erhaltung sind nicht zu trennen
5. ||
Etablierte Standards für das Vorgehen nur in wenigen Fächern
«Vertrauenskultur» sehr unterschiedlich ausgeprägt
Kundenerwartungen sowie technische und organisatorische
Anforderungen für «Open Data» und Langzeitarchivierung
stimmen nicht überein…
…obwohl sich beide Aspekte nicht trennen lassen
Bei Dienstleistungen ist bisher viel Einzelfallbehandlung nötig
Sowohl unseren Kunden als auch uns fehlt Erfahrung
26.05.2015
Herausforderungen
Matthias Töwe 5
6. || 26.05.2015
LZA vs. Zugänglichkeit vs. Openness
Matthias Töwe 6
Interne
Ablage
«Schliess-
fach»
Kurz-
fristiger
Austausch
/
«Sharing»
Dauerhaft,
aber
gesperrt
Dauerhaft
zugäng-
lich
Dauerhaft
nutzbar als
«Open
Data»
LZA
- - + + +
Daten-
publikation - (+) - + +
Open Data
- - - - +
Kunden erwarten Lösungen – am liebsten EINE Lösung
8. || 26.05.2015
Anwendungsfall: Interne Ablage – ‘Schliessfach’
Matthias Töwe 8
Interne
Ablage
«Schliess-
fach»
LZA
-
Daten-
publikation -
Open Data
-
Kann ETH Data Archive u.U. trotzdem ein passender Ort sein?
Daten sind statisch, werden nicht verändert und selten genutzt
Vereinbarter Verzicht auf Aufwand für Formatanalyse und alle
weiteren Erhaltungsmassnahmen
Nachteil für Kunden: Keine Selbstverwaltung
Charakteristik
Aufbewahrungsfrist ca. 10 Jahre
Archivierung «für den Fall der Fälle»
Zugriff für ausgewählte Personen einer
Forschungsgruppe
Seltene Nutzung
Metadaten unsichtbar für Dritte
9. ||
Ausgangslage
Sammlung von Dissertationen mit dazugehörigen Daten auf CD-ROM
Erfahrung: In den letzten zehn Jahren gab es eine Nachfrage
Metadaten auf der Ebene der ganzen Doktorarbeit
Tausende bis zehntausende von Dateien pro CD-ROM
Zum grossen Teil spezifische und selbst entwickelte Formate
Web-Zugriff für die Verantwortlichen gewünscht
Nur der Professor kann mit einiger Sicherheit in den Daten navigieren
Nachträgliche Anreicherung mit Metainformation oder Selektion der
Daten nicht realistisch
26.05.2015
Anwendungsfall: Interne Ablage - Beispiel
Matthias Töwe 9
10. ||
Alternative Lösung direkt auf kostengünstigem Speicher:
Keine Metadaten, kein Webzugriff, Objekte zu klein Nicht gewünscht
Umsetzung im Langzeitarchiv:
Formatidentifizierung und -validierung mehrheitlich nicht möglich
Beschränkung auf Erhaltung «wie geliefert»
Filezahlen und -strukturen nur handhabbar in Containern (ZIP/TAR)
Definierte Retention Period
Zugriff für Professor und letzten Mitarbeiter
Wenn vorhanden: Prüfsummenvergleich möglich
26.05.2015
Anwendungsfall: Interne Ablage - Ergebnis
Matthias Töwe 10
11. ||
Alternative Lösung direkt auf kostengünstigem Speicher:
Keine Metadaten, kein Webzugriff, Objekte zu klein Nicht gewünscht
Umsetzung im Langzeitarchiv (!):
Formatidentifizierung und -validierung mehrheitlich nicht möglich
Beschränkung auf Erhaltung «wie geliefert»
Filezahlen nur handhabbar in Containern (ZIP)
Definierte Retention Period
Zugriff für Professor und letzten Mitarbeiter
Wenn vorhanden: Prüfsummenvergleich möglich
Als ad hoc-Lösung ‘OK’ – aber können wir damit zufrieden sein?
26.05.2015
Anwendungsfall: Interne Ablage - Ergebnis
Matthias Töwe 11
12. ||
Langfristig
Auf bewussteres Datenmanagement in den Gruppen hinarbeiten!
Frühzeitige Planung in der Gruppe
(unabhängig davon, ob ein Plan verlangt wird)
Eigene Kriterien definieren und anwenden
Was soll und kann publiziert und archiviert werden?
Welche technische und inhaltliche Dokumentation ist dafür nötig?
Was soll zusätzlich befristet aufbewahrt werden?
Zusätzliches «Digitales Zwischenarchiv» einrichten?
26.05.2015
Anwendungsfall: Interne Ablage - Perspektive
Matthias Töwe 12
13. ||
Wie viel Vertrauen haben Forschende (und wir) in ihre Peers?
Wie viel und was wird frei zugänglich gemacht, was nur engen
Partnern?
Als Datenproduzenten (heute):
Umfang und Nutzen der Kontextdokumentation; vorausschauende
Entscheidung für oder gegen Veröffentlichung
Als Datennutzer (in der Zukunft):
Bereitschaft, Aufwand zur Nachnutzung «alter» Daten ungewisser Qualität
zu treiben; Verfügbarkeit der Kompetenzen, es auch zu tun
Was können Förderer oder Hochschulen «per Dekret» und ohne
Nebenwirkungen für die Forschenden beeinflussen?
26.05.2015
Fragen an die Datenproduzenten
Matthias Töwe 13
14. || 26.05.2015
Anwendungsfall:
Kurzfristiger Austausch / «Sharing»
Matthias Töwe 14
Kurz-
fristiger
Austausch
/ «Sharing»
LZA
-
Daten-
publikation (+)
Open Data
-
Langzeitarchiv ist in der Regel keine gute Lösung
Daten werden allenfalls (gemeinsam) ergänzt, bearbeitet, aktualisiert
Kunden erwarten Möglichkeit zur Selbstverwaltung des Zugriffs
Charakteristik
Aufbewahrungsfrist < 10 Jahre
Zugriff für ausgewählte Personen
ausserhalb der Institution
Metadaten unsichtbar für Dritte
Flexibilität gefragt
15. ||
Ausgangslage
«Lebende» Daten aus einem laufenden Projekt zur weiteren Ergänzung
und Bearbeitung
Nur ausgewählte Partner aus verschiedenen Institutionen dürfen
Zugriff haben
Nur im Projektkontext interpretierbare Metadaten
Implizite Information in Ablagestruktur
Nutzung in dieser Form für maximal 2 Jahre
Web-Zugriff gewünscht
26.05.2015
Anwendungsfall:
Kurzfristiger Austausch / «Sharing»
Matthias Töwe 15
16. ||
Ergebnis
Langzeitarchiv ist kein geeigneter Ablageort
Gemäss seiner Zielsetzung
Aus technischer Sicht
Alternative:
Erweiterung der für das gruppeninterne Datenmanagement genutzten
fachspezifischen Plattform (openBIS) durch die Informatikdienste
Falls noch kein spezifisches Tool genutzt wird:
Microsoft Sharepoint für einfache Dateien?
ETH polybox (Own Cloud) als niederschwelliger Weg zum Austausch
Weit weg von Langzeitarchivierung!
26.05.2015
Anwendungsfall:
Kurzfristiger Austausch / «Sharing»
Matthias Töwe 16
17. || 26.05.2015
Anwendungsfall:
Dauerhaft zu erhaltende, gesperrte Daten
Matthias Töwe 17
Dauerhaft,
aber
gesperrt
LZA
+
Daten-
publikation -
Open Data
-
Volle Funktionalität des Langzeitarchivs (OAIS) ist gefordert
Besondere Herausforderung:
Management des Zugriffs auf Metadaten
Charakteristik
Bei Forschungsdaten denkbar für nicht
anonymisierbare Daten
Typisch für Verwaltungs- und Nachlass-
archive (gesetzliche Sperrfristen)
Metadaten zunächst unsichtbar für Dritte
Gesetzliche Vorgaben zur Aufbewahrung
18. || 26.05.2015
Anwendungsfall:
Dauerhaft erhaltene, frei zugängliche Daten
Matthias Töwe 18
Dauerhaft
zugänglich
LZA
+
Daten-
publikation +
Open Data
-
Volle Funktionalität des Langzeitarchivs (OAIS) ist gefordert
Umfassende Kontextinformation entscheidet über Nutzbarkeit
Allenfalls Verbindung zu anderen Systemen als Voraussetzung für
Open Data-Nutzung?
Charakteristik
Dauerhafte Zugänglichkeit und
Nutzbarkeit
Metadaten werden frei verbreitet
Inhalte frei zugänglich…
…aber je nach System oder Lizenz nicht
unmittelbar als Open Data verfügbar
19. ||
Ausgangslage
Metadaten und Objekte sind frei zugänglich
Ursprünglicher Hauptanwendungsfall des ETH Data Archive!
Frei zugänglich – und doch nicht «open» gemäss Definition:
“Open data and content can be freely used, modified, and shared by anyone
for any purpose”
(Kurzfassung der Open Definition, http://opendefinition.org/, Zugriff 22.05.2015)
Eingeschränkt durch Lizenzbedingungen, z.B. Creative Commons
NonCommercial
Praktische Beschränkung der Nutzbarkeit durch Ausrichtung auf
Einzeldateien: Keine unmittelbar Nachnutzung einer Sammlung im
Langzeitarchiv, sondern erst nach Export der Dateien
26.05.2015
Anwendungsfall:
Dauerhaft zu erhaltende, frei zugängliche Daten
Matthias Töwe 19
20. || 26.05.2015
Anwendungsfall:
Dauerhaft erhalten und als Open Data nutzbar
Matthias Töwe 20
Dauerhaft
nutzbar als
«Open
Data»
LZA
+
Daten-
publikation +
Open Data
+
Funktionalität eines reinen Langzeitarchivs reicht u.U. nicht
Umfassende Kontextinformation entscheidet über Nutzbarkeit
LZA erhält zwar Beziehungen zwischen Objekten…
…für intensive Nutzung meist Export nötig
Charakteristik
Breite Nachnutzungsmöglichkeit wird
unterstützt (technisch und durch
entsprechende Lizenz)
Damit implizite Notwendigkeit für
dauerhafte Zugänglichkeit und
Nutzbarkeit als Datenquelle
Metadaten werden frei verbreitet
21. ||
Voraussetzungen und Massnahmen:
Ausreichendes Verständnis der Anforderungen im Einzelfall
Beratungsangebot zum Datenmanagement früh im Lebenszyklus
Frühzeitige Einblicke sind hilfreich, Kontakte vor Ort stärken
Eigene Service-Policy schärfen, einschliesslich ihrer Grenzen
Was können wir mit vertretbarem Aufwand für Kunden und uns anbieten?
Rechtslage weiter klären, z.B.:
Welche Lizenzen dürfen ETH-Angehörige vergeben?
ETH-Gesetz behält der ETH die meisten Immaterialgüterrechte vor
26.05.2015
Folgerungen für
bedarfsgerechte Dienstleistungen
Matthias Töwe 21
22. ||
Mittel- und langfristige Massnahmen:
Integration mit Anwendungen und Plattformen für komplementäre
Aufgaben > One-Stop-Shop
Elektronische Laborbücher (ELN) /
Labor-Informations- und Management-Systeme (LIMS)
Elektronisches Publizieren
Open Data Anwendungen
Metadatenmanagement
Redundante Ablage in mehreren Systemen statt wachsender
Komplexität durch verschiedenste Funktionen in der gleichen Anwendung?
Zertifizierung pro Workflow statt für das Langzeitarchiv insgesamt?
26.05.2015
Folgerungen für
bedarfsgerechte Dienstleistungen
Matthias Töwe 22