Erstellen von Sprach-Configs für den                Wiktionary ParserAlexander Lust                                       ...
Wiktionarymehrsprachiges Wörterbuch sowie ein entsprechendesThesaurus in jeder Sprache   Informationen zum Wort:        ...
Beispiel Wiktionary{{Wort der Woche|46|2006}}== Haus ({{{{Männliche Namensvarianten}}...{{Deutsch Substantiv Übersicht...|...
Aufgabe: Erstellen von Sprach-Configs für den             Wiktionary Parser    Problem: unterschiedliche Wiktionary Editi...
Beispiel: de to en<?xml version="1.0" encoding="UTF-8"?>2 <config>3 <ignore>4 <page startsWith="Vorlage:" />5 <page starts...
Evaluierung   Messen der Datenqualität mit vorhandenen Werkzeugen:        - Statistik Tools für RDF Wiki (Java-Programmmo...
Nächste SlideShare
Wird geladen in …5
×

Folien zum bericht wiktionary

262 Aufrufe

Veröffentlicht am

Veröffentlicht in: Geräte & Hardware
0 Kommentare
0 Gefällt mir
Statistik
Notizen
  • Als Erste(r) kommentieren

  • Gehören Sie zu den Ersten, denen das gefällt!

Keine Downloads
Aufrufe
Aufrufe insgesamt
262
Auf SlideShare
0
Aus Einbettungen
0
Anzahl an Einbettungen
8
Aktionen
Geteilt
0
Downloads
0
Kommentare
0
Gefällt mir
0
Einbettungen 0
Keine Einbettungen

Keine Notizen für die Folie
  • 56
  • 56
  • 56
  • 56
  • 56
  • 56
  • Folien zum bericht wiktionary

    1. 1. Erstellen von Sprach-Configs für den Wiktionary ParserAlexander Lust 1
    2. 2. Wiktionarymehrsprachiges Wörterbuch sowie ein entsprechendesThesaurus in jeder Sprache Informationen zum Wort: - Nebenformen -Aussprache - Bedeutungen - Herkunft - Taxonomien (Synonyme, Antonyme, Oberbegriffe, Unterbegriffe...) - Beispiele - Charakteristische Wortkombinationen - ... 2
    3. 3. Beispiel Wiktionary{{Wort der Woche|46|2006}}== Haus ({{{{Männliche Namensvarianten}}...{{Deutsch Substantiv Übersicht...|Nominativ Singular=das Haus|Nominativ Plural=die Häuser|Genitiv Singular=des Hauses...{{Aussprache}}:{{IPA}} {{Lautschrift|haʊ̯ s}}, {{Pl.}} {{Lautschrift|ˈ hɔɪ̯ zɐ }}...{{Bedeutungen}}:[1] [[Unterkunft]], [[Gebäude]]:[3] die [[Gemeinschaft]] der [[Mensch]]en, die unter einem [[Dach]][[zusammen]] leben bzw. [[wohnen]] bzw. [[arbeiten]]... 3
    4. 4. Aufgabe: Erstellen von Sprach-Configs für den Wiktionary Parser  Problem: unterschiedliche Wiktionary Editionen Lösung: für jede Sprachvariante eine XML-basierte Konfiguration 4
    5. 5. Beispiel: de to en<?xml version="1.0" encoding="UTF-8"?>2 <config>3 <ignore>4 <page startsWith="Vorlage:" />5 <page startsWith="de:Vorlage:" />6 <page startsWith="de:Kategorie:" />...150 <mapping from="Krimtatarisch" to="CrimeanTatar" />152 <mapping from="Urartäisch" to="Urartian" />...311 <property uri="http://wiktionary.dbpedia.org/terms/hasSense"/>...353 <!-- a type declaration -->354 <triple s="http://wiktionary.dbpedia.org/resource/uri($entityId)"p="http://www.w3.org/1999/02/22-rdf-syntax-ns#type"o="http://wiktionary.dbpedia.org/terms/LexicalEntity" oType="URI"/>355 </triples> 5
    6. 6. Evaluierung Messen der Datenqualität mit vorhandenen Werkzeugen: - Statistik Tools für RDF Wiki (Java-Programmmodul für Finden von wichtigen Properties oder Objekten in RDF-Datei & Berechnen ihres Gewicht IF-IDF) 6

    ×