Strukturierte Metadaten in Wikipedia

2.641 Aufrufe

Veröffentlicht am

Vortrag auf dem KIM-Workshop„Sind Metadaten teamfähig oderwas macht Metadatenformate interoperabel?“ auf dem Bibliothekartag 2008 in Mannheimam 4.6.2008

Veröffentlicht in: Technologie
0 Kommentare
0 Gefällt mir
Statistik
Notizen
  • Als Erste(r) kommentieren

  • Gehören Sie zu den Ersten, denen das gefällt!

Keine Downloads
Aufrufe
Aufrufe insgesamt
2.641
Auf SlideShare
0
Aus Einbettungen
0
Anzahl an Einbettungen
15
Aktionen
Geteilt
0
Downloads
5
Kommentare
0
Gefällt mir
0
Einbettungen 0
Keine Einbettungen

Keine Notizen für die Folie

Strukturierte Metadaten in Wikipedia

  1. 1. Jakob Voß Verbundzentrale des GBV (VZG) Strukturierte Metadaten in Wikipedia Vortrag auf dem KIM-Workshop „ Sind Metadaten teamfähig oder was macht Metadatenformate interoperabel? “ auf dem Bibliothek ar tag in Mannheim am 4.6.2008 s VZG
  2. 2. __TOC__ <ul><ul><li>Metadaten und Wikipedia </li></ul></ul><ul><ul><li>Zugriff auf die Daten </li></ul></ul><ul><ul><li>Qualität </li></ul></ul><ul><ul><li>Anwendungsbeispiele </li></ul></ul><ul><ul><li>Bewertung </li></ul></ul>
  3. 3. Metadaten und Wikipedia <ul><li>Metadaten über Wikipedia </li></ul><ul><li>Metadaten in Wikipedia </li></ul>
  4. 4. Metadaten und Wikipedia <ul><li>Metadaten über Wikipedia </li></ul><ul><ul><li>Artikel, Autoren, Versionen, Verweise ... </li></ul></ul><ul><ul><li>Bewertung, Wartung ... </li></ul></ul>
  5. 5. Metadaten und Wikipedia <ul><li>Metadaten in Wikipedia </li></ul><ul><ul><li>Kategorien </li></ul></ul><ul><ul><li>Spezielle Seiten: Listen, Chronik ... </li></ul></ul><ul><ul><li>Vorlagen </li></ul></ul><ul><ul><ul><li>Infoboxen </li></ul></ul></ul><ul><ul><ul><li>Navigationsleisten </li></ul></ul></ul><ul><ul><ul><li>Personendaten </li></ul></ul></ul><ul><ul><ul><li>Datenbanklink (z.B. PND-Links, ISBNs ...) </li></ul></ul></ul><ul><ul><li>Literaturangaben, Zitate ... </li></ul></ul><ul><ul><li>Interwikilinks, Begriffsklärungsseiten ... </li></ul></ul>
  6. 6. Beispiel
  7. 7. Zugriff auf die Daten <ul><li>Eigene Verarbeitung </li></ul><ul><ul><li>http://www.mediawiki.org/wiki/API </li></ul></ul><ul><ul><li>Datenbank-Dumps (etwa monatlich) </li></ul></ul><ul><li>Extrahierte Daten </li></ul><ul><ul><li>DBPedia </li></ul></ul><ul><ul><li>Extractor </li></ul></ul><ul><ul><li>TemplateTiger </li></ul></ul><ul><li>Strukturierte Metadaten direkt </li></ul><ul><ul><li>Semantic MediaWiki (geplant) </li></ul></ul>
  8. 8. Qualität der Daten <ul><li>Spezialisierte Autorenteams und Redaktionen </li></ul><ul><li>Quellenangaben </li></ul><ul><li>„Endredaktion“/„Releases“ geplant mit den „geprüften Versionen“ </li></ul><ul><li>Wie gut sind die Alternativen?! </li></ul>
  9. 9. Qualität durch Feedback Anwendung und Analyse Feedback Extraktion
  10. 10. Qualität durch Feedback Anwendung und Analyse PND durchschnittlich etwa 2-3 Korrekturen/Tag siehe [[Wikipedia:PND/Fehlermeldung]] Extraktion Feedback
  11. 11. Anwendungsbeispiele <ul><li>RDF-Export als „Linked Data“ und Zugriff via SPARQL (DBPedia) </li></ul><ul><li>Automatische Thesaurus-Erstellung </li></ul><ul><li>Analyse von Literaturangaben </li></ul><ul><li>Darauf aufbauende Anwendungen und Webservices („Mashups“) </li></ul>
  12. 12. Einfache Ansicht Linked Data http://dbpedia.org/resource/ Leipzig
  13. 13. SeeAlso Linkserver ISBN ISBN+Artikel aus Datenbankdump Links
  14. 14. Bewertung <ul><li>Wikipedia (und andere Wikis) liefern eine Fülle gemeinsam von Nutzern generierter Metadaten. </li></ul><ul><li>Inhalte sind eher semi-strukturiert, d.h. Nachbearbeitung ist nötig. </li></ul><ul><li>Dafür sind die Inhalte unter einer freien Lizenz verfügbar. </li></ul><ul><li>Metadaten in Wikipedia gehen von Inhalten statt von Formaten und Konzepten aus (Bottom-Up). </li></ul>

×