Was Wissenschaftler wirklich wollen Such- und Metadatenstrategien für digitale Repositorien am Beispiel von "Goobi&qu...
Seien wir ehrlich:
WIR WISSEN ES NICHT.
Endnutzer – wer ist das? <ul><li>Wissenschaftler </li></ul><ul><li>Schüler/Studierende </li></ul><ul><li>Laien </li></ul><...
Nutzungsarten <ul><li>Suche / Retrieval </li></ul><ul><ul><li>Das einzelne Objekt als Ziel </li></ul></ul><ul><li>Semantis...
Dimensionen der Digitalisierung
ZENDEF
ZENDEF <ul><li>Zitierbar </li></ul><ul><li>Erreichbar </li></ul><ul><li>(nach)Nutzbar </li></ul><ul><li>Durchsuchbar </li>...
ZENDEF <ul><li>Zitierbar </li></ul><ul><ul><li>Persistente Identifier Struktur (PID) </li></ul></ul><ul><li>Erreichbar </l...
<ul><li>Erreichbar / Nutzbar </li></ul><ul><ul><li>Massendigitalisierung mit Scanrobotern </li></ul></ul><ul><ul><li>Krist...
Strukturmetadatengenerierung
Erschließungstiefe Bibliographische Metadaten Struktur- Metadaten Volltexte Manuelle Erschließung Bibliotheken Wissenschaf...
Beispiel Strukturmetadaten
Strukturmetadaten = digitales Inhaltsverzeichnis navigier- und durchsuchbar machen
Der Aufwand <ul><li>Paginierungssequenzen erstellen Verhältnis von gescannter zu aufgedruckter Seite </li></ul><ul><li>Abs...
Paginierungssequenzen
OCR gestützte Anreicherung
Der Aufwand <ul><li>Derzeit: für viele Materialien nur händische Verfahren sinnvoll </li></ul><ul><li>Bei Antiqua und begr...
Aufwand je Projekt VD18 Rezensionszeitschriften DigiZeitschriften Mathematik
RusDML – worst case
Typische Laufzeiten im Produktionsprozess <ul><li>300 Seiten Band (Mathematik) </li></ul><ul><li>Arbeitsvorbereitungen (25...
Lohnt der ganze Aufwand Und was können wir durch Volltexte subsumieren?
Projekt: eAqua <ul><li>Kooperation: </li></ul><ul><ul><li>Institut für Informatik - Computerlinguistik, Leipzig (Büchler, ...
Semantische Suche „Sozialismus“ auf Strukturdaten
Semantische Suche „Mephisto“ auf Strukturdaten
Semantische Suche „Mephisto“ auf Volltexten
Ergebnisse <ul><li>Strukturmetadaten unentbehrlich für das Aufbauen digitaler Inhaltsverzeichnisse (Navigation) </li></ul>...
Die Zukunft <ul><li>Projekt: Europeana Connect </li></ul><ul><li>Visualisierung von Daten interaktiv in Raum und Zeit („4D...
Semantische / qualitative Analysen Goethe
Goethe Schiller
Ausblick und Fazit
Goobi Verbreitung www.goobi.org
Goobi Homepage www.goobi.org
Goobi Blog www.goobi.org/blog
Goobi Forum in Kürze über Homepage zu erreichen
Wir wissen vielleicht nicht, was Wissenschaftler wollen... ...aber wir können relativ genau sagen, was sie NICHT wollen
Überwindung der Provinienz <ul><li>Es interessiert keinen Wissenschaftler, in welcher Bibliothek seine Forschungsliteratur...
ACHTUNG! <ul><li>Wir versündigen uns an einer ganzen Generation von Wissenschaftlern, wenn wir Produktkonkurrenz auf dem R...
Nächste SlideShare
Wird geladen in …5
×

Was Wissenschaftler wirklich Wollen

1.810 Aufrufe

Veröffentlicht am

Goobi Präsentation auf dem BibTag 2010 in Leipzig

Veröffentlicht in: Bildung
0 Kommentare
1 Gefällt mir
Statistik
Notizen
  • Als Erste(r) kommentieren

Keine Downloads
Aufrufe
Aufrufe insgesamt
1.810
Auf SlideShare
0
Aus Einbettungen
0
Anzahl an Einbettungen
53
Aktionen
Geteilt
0
Downloads
19
Kommentare
0
Gefällt mir
1
Einbettungen 0
Keine Einbettungen

Keine Notizen für die Folie

Was Wissenschaftler wirklich Wollen

  1. 1. Was Wissenschaftler wirklich wollen Such- und Metadatenstrategien für digitale Repositorien am Beispiel von &quot;Goobi&quot;
  2. 2. Seien wir ehrlich:
  3. 3. WIR WISSEN ES NICHT.
  4. 4. Endnutzer – wer ist das? <ul><li>Wissenschaftler </li></ul><ul><li>Schüler/Studierende </li></ul><ul><li>Laien </li></ul><ul><li>Google (und andere Dienste) </li></ul>
  5. 5. Nutzungsarten <ul><li>Suche / Retrieval </li></ul><ul><ul><li>Das einzelne Objekt als Ziel </li></ul></ul><ul><li>Semantische / qualitative Analysen </li></ul><ul><ul><li>Themenkarrieren </li></ul></ul><ul><ul><li>Netzwerke (Personen) </li></ul></ul><ul><ul><li>Die Summe der Objekte - das Repository - als Werkzeug und Untersuchungsgegenstand </li></ul></ul><ul><li>Text- und Editionsarbeit </li></ul><ul><ul><li>Virtuelle Forschungsumgebungen </li></ul></ul><ul><ul><li>Teilobjekte (Abschnitte, Sätze, Worte) als erweiterbare und kombinierbare Einheiten </li></ul></ul>
  6. 6. Dimensionen der Digitalisierung
  7. 7. ZENDEF
  8. 8. ZENDEF <ul><li>Zitierbar </li></ul><ul><li>Erreichbar </li></ul><ul><li>(nach)Nutzbar </li></ul><ul><li>Durchsuchbar </li></ul><ul><li>Erweiterbar </li></ul><ul><li>Findbar </li></ul>
  9. 9. ZENDEF <ul><li>Zitierbar </li></ul><ul><ul><li>Persistente Identifier Struktur (PID) </li></ul></ul><ul><li>Erreichbar </li></ul><ul><ul><li>Digitalisiert, Stabilität, Performance </li></ul></ul><ul><li>(nach)Nutzbar </li></ul><ul><ul><li>Qualität, flexible Datenformate </li></ul></ul><ul><li>Durchsuchbar </li></ul><ul><ul><li>Metadaten (Bibl. & Struktur), Volltexte </li></ul></ul><ul><li>Erweiterbar </li></ul><ul><ul><li>Virtuelle Forschungsumgebungen </li></ul></ul><ul><li>Findbar </li></ul><ul><ul><li>OPAC, Google & co </li></ul></ul>
  10. 10. <ul><li>Erreichbar / Nutzbar </li></ul><ul><ul><li>Massendigitalisierung mit Scanrobotern </li></ul></ul><ul><ul><li>Kristina Lippold, Dresden </li></ul></ul><ul><li>Durchsuchbar / Findbar </li></ul><ul><ul><li>OCR Renderfarmen und TEI </li></ul></ul><ul><ul><li>Christian Mahnke, Göttingen </li></ul></ul><ul><li>Nachnutzbar </li></ul><ul><ul><li>Standards für Datenformate und -übertragung </li></ul></ul><ul><ul><li>Sebastian Meyer, Dresden </li></ul></ul><ul><li>Durchsuchbar / Findbar </li></ul><ul><ul><li>Strukturmetadatengenerierung </li></ul></ul><ul><ul><li>Ralf Stockmann, Göttingen </li></ul></ul><ul><li>Nachnutzbar </li></ul><ul><ul><li>Das Digitalisat im Netz - Werkzeuge für die Nutzer </li></ul></ul><ul><ul><li>Sebastian Meyer, Dresden </li></ul></ul><ul><li>Zusammenfassung und Fazit </li></ul><ul><ul><li>Ralf Stockmann, Göttingen </li></ul></ul>
  11. 11. Strukturmetadatengenerierung
  12. 12. Erschließungstiefe Bibliographische Metadaten Struktur- Metadaten Volltexte Manuelle Erschließung Bibliotheken Wissenschaftler
  13. 13. Beispiel Strukturmetadaten
  14. 14. Strukturmetadaten = digitales Inhaltsverzeichnis navigier- und durchsuchbar machen
  15. 15. Der Aufwand <ul><li>Paginierungssequenzen erstellen Verhältnis von gescannter zu aufgedruckter Seite </li></ul><ul><li>Abstrakte Strukturen aufbauen Das Kapitel liegt in Ebene drei und reicht von Seite x bis xx </li></ul><ul><li>Das einzelne Strukturelement mit konkreten Metadaten füllen Das Kapitel hat den Titel X und den Autor XX </li></ul>
  16. 16. Paginierungssequenzen
  17. 17. OCR gestützte Anreicherung
  18. 18. Der Aufwand <ul><li>Derzeit: für viele Materialien nur händische Verfahren sinnvoll </li></ul><ul><li>Bei Antiqua und begrenzt jüngerer Fraktur OCR-gestützte, Halbautomatiken denkbar </li></ul>
  19. 19. Aufwand je Projekt VD18 Rezensionszeitschriften DigiZeitschriften Mathematik
  20. 20. RusDML – worst case
  21. 21. Typische Laufzeiten im Produktionsprozess <ul><li>300 Seiten Band (Mathematik) </li></ul><ul><li>Arbeitsvorbereitungen (25 Min.) </li></ul><ul><ul><li>Ausheben </li></ul></ul><ul><ul><li>Digitale Uraufnahme </li></ul></ul><ul><li>Digitalisierung (40 Minuten) </li></ul><ul><li>Qualitätskontrolle (10 Minuten) </li></ul><ul><li>Imageoptimierung (10 Minuten) </li></ul><ul><li>Strukturdatengenerierung (40 Minuten) </li></ul><ul><li>Import (5 Minuten) </li></ul><ul><li>600 Seiten Band (DigiZeitschriften) </li></ul><ul><li>Arbeitsvorbereitungen (25 Min.) </li></ul><ul><ul><li>Ausheben </li></ul></ul><ul><ul><li>Digitale Uraufnahme </li></ul></ul><ul><li>Digitalisierung (70 Minuten) </li></ul><ul><li>Qualitätskontrolle (18 Minuten) </li></ul><ul><li>Imageoptimierung (10 Minuten) </li></ul><ul><li>Strukturdatengenerierung (8 Stunden) </li></ul><ul><li>Import (10 Minuten) </li></ul>
  22. 22. Lohnt der ganze Aufwand Und was können wir durch Volltexte subsumieren?
  23. 23. Projekt: eAqua <ul><li>Kooperation: </li></ul><ul><ul><li>Institut für Informatik - Computerlinguistik, Leipzig (Büchler, Eckart, Heyer, Baumgardt) </li></ul></ul><ul><ul><li>SUB Göttingen (Stockmann, Kothe, Mahnke) </li></ul></ul><ul><li>Konkreter Vergleich: semantische Graphen zwischen Strukturdaten und Volltexten </li></ul>
  24. 24. Semantische Suche „Sozialismus“ auf Strukturdaten
  25. 25. Semantische Suche „Mephisto“ auf Strukturdaten
  26. 26. Semantische Suche „Mephisto“ auf Volltexten
  27. 27. Ergebnisse <ul><li>Strukturmetadaten unentbehrlich für das Aufbauen digitaler Inhaltsverzeichnisse (Navigation) </li></ul><ul><li>Im Bereich der Suche werden (OCR) Volltexte mittelfristig bessere Ergebnisse liefern </li></ul><ul><li>Semantische Relevanz von Strukturmetadaten schwankt extrem mit der Beschaffenheit des Materials </li></ul>
  28. 28. Die Zukunft <ul><li>Projekt: Europeana Connect </li></ul><ul><li>Visualisierung von Daten interaktiv in Raum und Zeit („4D“) </li></ul><ul><li>Kooperation von </li></ul><ul><ul><li>SUB Göttingen (Mahnke / Stockmann) </li></ul></ul><ul><ul><li>Institut für Informatik (Scheuermann / Jänicke) </li></ul></ul>
  29. 29. Semantische / qualitative Analysen Goethe
  30. 30. Goethe Schiller
  31. 31. Ausblick und Fazit
  32. 32. Goobi Verbreitung www.goobi.org
  33. 33. Goobi Homepage www.goobi.org
  34. 34. Goobi Blog www.goobi.org/blog
  35. 35. Goobi Forum in Kürze über Homepage zu erreichen
  36. 36. Wir wissen vielleicht nicht, was Wissenschaftler wollen... ...aber wir können relativ genau sagen, was sie NICHT wollen
  37. 37. Überwindung der Provinienz <ul><li>Es interessiert keinen Wissenschaftler, in welcher Bibliothek seine Forschungsliteratur steht. </li></ul><ul><li>Noch viel weniger interessiert ihn, in welchem Repository er die digitale Fassung gefunden hat. </li></ul><ul><li>Digitale Werkzeuge MÜSSEN system- und applikationsübergreifend funktionieren: </li></ul><ul><ul><li>Bookmarking </li></ul></ul><ul><ul><li>Vernetzung </li></ul></ul><ul><ul><li>Kommentierung </li></ul></ul><ul><ul><li>Kollaboration </li></ul></ul>
  38. 38. ACHTUNG! <ul><li>Wir versündigen uns an einer ganzen Generation von Wissenschaftlern, wenn wir Produktkonkurrenz auf dem Rücken der Forscher austragen </li></ul><ul><li>Wir brauchen keinen Wettbewerb um lokal implementierte Features, sondern einen Wettbewerb um die beste Implementierung offener Standards </li></ul><ul><li>Im Zweifelsfall werden die Wissenschaftler in Zukunft dahin gehen wo Vernetzung funktioniert (Google) </li></ul>

×