Diese Präsentation wurde erfolgreich gemeldet.
Wir verwenden Ihre LinkedIn Profilangaben und Informationen zu Ihren Aktivitäten, um Anzeigen zu personalisieren und Ihnen relevantere Inhalte anzuzeigen. Sie können Ihre Anzeigeneinstellungen jederzeit ändern.
Erstellen von Sprach-Configs für den                Wiktionary ParserAlexander Lust                                       ...
Wiktionarymehrsprachiges Wörterbuch sowie ein entsprechendesThesaurus in jeder Sprache   Informationen zum Wort:        ...
Beispiel Wiktionary{{Wort der Woche|46|2006}}== Haus ({{{{Männliche Namensvarianten}}...{{Deutsch Substantiv Übersicht...|...
Aufgabe: Erstellen von Sprach-Configs für den             Wiktionary Parser    Problem: unterschiedliche Wiktionary Editi...
Beispiel: de to en<?xml version="1.0" encoding="UTF-8"?>2 <config>3 <ignore>4 <page startsWith="Vorlage:" />5 <page starts...
Evaluierung   Messen der Datenqualität mit vorhandenen Werkzeugen:        - Statistik Tools für RDF Wiki (Java-Programmmo...
Nächste SlideShare
Wird geladen in …5
×

Folien zum bericht wiktionary

180 Aufrufe

Veröffentlicht am

  • Als Erste(r) kommentieren

  • Gehören Sie zu den Ersten, denen das gefällt!

Folien zum bericht wiktionary

  1. 1. Erstellen von Sprach-Configs für den Wiktionary ParserAlexander Lust 1
  2. 2. Wiktionarymehrsprachiges Wörterbuch sowie ein entsprechendesThesaurus in jeder Sprache Informationen zum Wort: - Nebenformen -Aussprache - Bedeutungen - Herkunft - Taxonomien (Synonyme, Antonyme, Oberbegriffe, Unterbegriffe...) - Beispiele - Charakteristische Wortkombinationen - ... 2
  3. 3. Beispiel Wiktionary{{Wort der Woche|46|2006}}== Haus ({{{{Männliche Namensvarianten}}...{{Deutsch Substantiv Übersicht...|Nominativ Singular=das Haus|Nominativ Plural=die Häuser|Genitiv Singular=des Hauses...{{Aussprache}}:{{IPA}} {{Lautschrift|haʊ̯ s}}, {{Pl.}} {{Lautschrift|ˈ hɔɪ̯ zɐ }}...{{Bedeutungen}}:[1] [[Unterkunft]], [[Gebäude]]:[3] die [[Gemeinschaft]] der [[Mensch]]en, die unter einem [[Dach]][[zusammen]] leben bzw. [[wohnen]] bzw. [[arbeiten]]... 3
  4. 4. Aufgabe: Erstellen von Sprach-Configs für den Wiktionary Parser  Problem: unterschiedliche Wiktionary Editionen Lösung: für jede Sprachvariante eine XML-basierte Konfiguration 4
  5. 5. Beispiel: de to en<?xml version="1.0" encoding="UTF-8"?>2 <config>3 <ignore>4 <page startsWith="Vorlage:" />5 <page startsWith="de:Vorlage:" />6 <page startsWith="de:Kategorie:" />...150 <mapping from="Krimtatarisch" to="CrimeanTatar" />152 <mapping from="Urartäisch" to="Urartian" />...311 <property uri="http://wiktionary.dbpedia.org/terms/hasSense"/>...353 <!-- a type declaration -->354 <triple s="http://wiktionary.dbpedia.org/resource/uri($entityId)"p="http://www.w3.org/1999/02/22-rdf-syntax-ns#type"o="http://wiktionary.dbpedia.org/terms/LexicalEntity" oType="URI"/>355 </triples> 5
  6. 6. Evaluierung Messen der Datenqualität mit vorhandenen Werkzeugen: - Statistik Tools für RDF Wiki (Java-Programmmodul für Finden von wichtigen Properties oder Objekten in RDF-Datei & Berechnen ihres Gewicht IF-IDF) 6

×