SlideShare ist ein Scribd-Unternehmen logo

Wissensrepräsentation in kontrolliertem Englisch

See doctoral thesis for details: http://attempto.ifi.uzh.ch/site/pubs/papers/doctoral_thesis_kuhn.pdf

1 von 14
Downloaden Sie, um offline zu lesen
Wissensrepräsentation in
kontrolliertem Englisch
Tobias Kuhn
Institut für Informatik & Institut für Computerlinguistik
Universität Zürich
Mercator-Preis
22. September 2009
???? ??
??
?
Tobias Kuhn, Mercator-Preis 2009, Universität Zürich 2
Problem
 Das World Wide Web enthält Unmengen von Informationen, wovon
der Grossteil in natürlicher Sprache verfasst ist
 Automatisches Verstehen natürlicher Sprache durch Computer ist
ein ungelöstes Problem trotz jahrzehntelanger Forschung
 Folgen:
 Nur Stichwort-basierte Suche
 Keine automatische Beantwortung von Fragen
 Keine “intelligenten” Programme, die das Wissen aus dem Web
anwenden
Tobias Kuhn, Mercator-Preis 2009, Universität Zürich 3
Problem: Beispiel
 Die Frage kann nicht automatisch beantwortet werden, obwohl die
nötige Information vorhanden ist
“Welche Städte in einem Binnenland haben mindestens
zwei Universitäten?”
Tobias Kuhn, Mercator-Preis 2009, Universität Zürich 4
Mögliche Lösung: formale
Wissensrepräsentation
 Idee: die Information wird nicht in natürlicher Sprache sondern in
einer formalen, Logik-basierten Sprache repräsentiert:
 Sogenannte “Reasoner” können dann verschiedene Probleme
automatisch lösen:
 Konsistenzprüfung: Gibt es irgendwo einen Widerspruch?
 Antworten zu einer Frage fnden
 Beweise führen
 Problem: Die Logiknotationen sind schwierig zu verstehen ohne
spezifsche Ausbildung
∀X(country(X) ⋀ –∃Y(sea(Y) ⋀ border(X,Y)) → landlocked(X))
Tobias Kuhn, Mercator-Preis 2009, Universität Zürich 5
Natürliche und formale Sprachen
Countries that border
no sea are landlocked
countries.
∀X(country(X) ⋀
–∃Y(sea(Y) ⋀
border(X,Y)
) →
landlocked(X)
)
Tobias Kuhn, Mercator-Preis 2009, Universität Zürich 6
Kontrollierte natürliche Sprachen
 Kontrollierte natürliche Sprachen sind Teilmengen von natürlichen
Sprachen
 Formale Sprachen, die natürlich aussehen
 Vereinen die intuitive Verständlichkeit natürlicher Sprachen mit
der Exaktheit formaler Sprachen
 Sollen die Kommunikation zwischen Mensch und Computer
verbessern
 Direkte Verbindung zu formaler Logik
 Beispiel: Attempto Controlled English (ACE)
∀X(country(X) ⋀ –∃Y(sea(Y) ⋀
border(X,Y)) → landlocked(X))
Every country that borders no
sea is a landlocked country.

Recomendados

Nanopublications and Decentralized Publishing
Nanopublications and Decentralized PublishingNanopublications and Decentralized Publishing
Nanopublications and Decentralized PublishingTobias Kuhn
 
Linked Data Publishing with Nanopublications
Linked Data Publishing with NanopublicationsLinked Data Publishing with Nanopublications
Linked Data Publishing with NanopublicationsTobias Kuhn
 
Genuine semantic publishing
Genuine semantic publishingGenuine semantic publishing
Genuine semantic publishingTobias Kuhn
 
A Decentralized Approach to Dissemination, Retrieval, and Archiving of Data
A Decentralized Approach to Dissemination, Retrieval, and Archiving of DataA Decentralized Approach to Dissemination, Retrieval, and Archiving of Data
A Decentralized Approach to Dissemination, Retrieval, and Archiving of DataTobias Kuhn
 
The Controlled Natural Language of Randall Munroe’s Thing Explainer
The Controlled Natural Language of Randall Munroe’s Thing Explainer The Controlled Natural Language of Randall Munroe’s Thing Explainer
The Controlled Natural Language of Randall Munroe’s Thing Explainer Tobias Kuhn
 
Publishing without Publishers: a Decentralized Approach to Dissemination, Ret...
Publishing without Publishers: a Decentralized Approach to Dissemination, Ret...Publishing without Publishers: a Decentralized Approach to Dissemination, Ret...
Publishing without Publishers: a Decentralized Approach to Dissemination, Ret...Tobias Kuhn
 
nanopub-java: A Java Library for Nanopublications
nanopub-java: A Java Library for Nanopublicationsnanopub-java: A Java Library for Nanopublications
nanopub-java: A Java Library for NanopublicationsTobias Kuhn
 
Semantic Publishing and Nanopublications
Semantic Publishing and NanopublicationsSemantic Publishing and Nanopublications
Semantic Publishing and NanopublicationsTobias Kuhn
 

Más contenido relacionado

Mehr von Tobias Kuhn

Scientific Data Publishing
Scientific Data PublishingScientific Data Publishing
Scientific Data PublishingTobias Kuhn
 
A Decentralized Network for Publishing Linked Data — Nanopublications, Trusty...
A Decentralized Network for Publishing Linked Data — Nanopublications, Trusty...A Decentralized Network for Publishing Linked Data — Nanopublications, Trusty...
A Decentralized Network for Publishing Linked Data — Nanopublications, Trusty...Tobias Kuhn
 
Science Bots: A Model for the Future of Scientific Computation?
Science Bots: A Model for the Future of Scientific Computation?Science Bots: A Model for the Future of Scientific Computation?
Science Bots: A Model for the Future of Scientific Computation?Tobias Kuhn
 
Data Publishing and Post-Publication Reviews
Data Publishing and Post-Publication ReviewsData Publishing and Post-Publication Reviews
Data Publishing and Post-Publication ReviewsTobias Kuhn
 
Semantic Publishing with Nanopublications
Semantic Publishing with Nanopublications Semantic Publishing with Nanopublications
Semantic Publishing with Nanopublications Tobias Kuhn
 
Meme Extraction from Corpora of Scientific Literature using Citation Networks
Meme Extraction from Corpora of Scientific Literature using Citation NetworksMeme Extraction from Corpora of Scientific Literature using Citation Networks
Meme Extraction from Corpora of Scientific Literature using Citation NetworksTobias Kuhn
 
A Multilingual Semantic Wiki Based on Controlled Natural Language
A Multilingual Semantic Wiki Based on Controlled Natural LanguageA Multilingual Semantic Wiki Based on Controlled Natural Language
A Multilingual Semantic Wiki Based on Controlled Natural LanguageTobias Kuhn
 
Citation Graph Analysis to Identify Memes in Scientific Literature
Citation Graph Analysis to Identify Memes in Scientific LiteratureCitation Graph Analysis to Identify Memes in Scientific Literature
Citation Graph Analysis to Identify Memes in Scientific LiteratureTobias Kuhn
 
Citation Graph Analysis to Identify Memes in Scientific Literature
Citation Graph Analysis to Identify Memes in Scientific LiteratureCitation Graph Analysis to Identify Memes in Scientific Literature
Citation Graph Analysis to Identify Memes in Scientific LiteratureTobias Kuhn
 
Trusty URIs: Verifiable, Immutable, and Permanent Digital Artifacts for Linke...
Trusty URIs: Verifiable, Immutable, and Permanent Digital Artifacts for Linke...Trusty URIs: Verifiable, Immutable, and Permanent Digital Artifacts for Linke...
Trusty URIs: Verifiable, Immutable, and Permanent Digital Artifacts for Linke...Tobias Kuhn
 
Automatische Übersetzung in einem multilingualen, semantischen Wiki
Automatische Übersetzung in einem multilingualen, semantischen WikiAutomatische Übersetzung in einem multilingualen, semantischen Wiki
Automatische Übersetzung in einem multilingualen, semantischen WikiTobias Kuhn
 
A Multilingual Semantic Wiki based on Attempto Controlled English and Grammat...
A Multilingual Semantic Wiki based on Attempto Controlled English and Grammat...A Multilingual Semantic Wiki based on Attempto Controlled English and Grammat...
A Multilingual Semantic Wiki based on Attempto Controlled English and Grammat...Tobias Kuhn
 
A Multilingual Semantic Wiki based on Attempto Controlled English and Grammat...
A Multilingual Semantic Wiki based on Attempto Controlled English and Grammat...A Multilingual Semantic Wiki based on Attempto Controlled English and Grammat...
A Multilingual Semantic Wiki based on Attempto Controlled English and Grammat...Tobias Kuhn
 
Improving Text Mining with Controlled Natural Language: A Case Study for Prot...
Improving Text Mining with Controlled Natural Language: A Case Study for Prot...Improving Text Mining with Controlled Natural Language: A Case Study for Prot...
Improving Text Mining with Controlled Natural Language: A Case Study for Prot...Tobias Kuhn
 
AceRules: Executing Rules in Controlled Natural Language
AceRules: Executing Rules in Controlled Natural LanguageAceRules: Executing Rules in Controlled Natural Language
AceRules: Executing Rules in Controlled Natural LanguageTobias Kuhn
 
AceWiki: A Natural and Expressive Semantic Wiki
AceWiki: A Natural and Expressive Semantic WikiAceWiki: A Natural and Expressive Semantic Wiki
AceWiki: A Natural and Expressive Semantic WikiTobias Kuhn
 
AceWiki: Controlled English in a Semantic Wiki
AceWiki: Controlled English in a Semantic WikiAceWiki: Controlled English in a Semantic Wiki
AceWiki: Controlled English in a Semantic WikiTobias Kuhn
 
How Controlled English can Improve Semantic Wikis
How Controlled English can Improve Semantic WikisHow Controlled English can Improve Semantic Wikis
How Controlled English can Improve Semantic WikisTobias Kuhn
 
How to Evaluate Controlled Natural Languages
How to Evaluate Controlled Natural LanguagesHow to Evaluate Controlled Natural Languages
How to Evaluate Controlled Natural LanguagesTobias Kuhn
 

Mehr von Tobias Kuhn (20)

Scientific Data Publishing
Scientific Data PublishingScientific Data Publishing
Scientific Data Publishing
 
A Decentralized Network for Publishing Linked Data — Nanopublications, Trusty...
A Decentralized Network for Publishing Linked Data — Nanopublications, Trusty...A Decentralized Network for Publishing Linked Data — Nanopublications, Trusty...
A Decentralized Network for Publishing Linked Data — Nanopublications, Trusty...
 
Science Bots: A Model for the Future of Scientific Computation?
Science Bots: A Model for the Future of Scientific Computation?Science Bots: A Model for the Future of Scientific Computation?
Science Bots: A Model for the Future of Scientific Computation?
 
Data Publishing and Post-Publication Reviews
Data Publishing and Post-Publication ReviewsData Publishing and Post-Publication Reviews
Data Publishing and Post-Publication Reviews
 
Semantic Publishing with Nanopublications
Semantic Publishing with Nanopublications Semantic Publishing with Nanopublications
Semantic Publishing with Nanopublications
 
Nanopubs
NanopubsNanopubs
Nanopubs
 
Meme Extraction from Corpora of Scientific Literature using Citation Networks
Meme Extraction from Corpora of Scientific Literature using Citation NetworksMeme Extraction from Corpora of Scientific Literature using Citation Networks
Meme Extraction from Corpora of Scientific Literature using Citation Networks
 
A Multilingual Semantic Wiki Based on Controlled Natural Language
A Multilingual Semantic Wiki Based on Controlled Natural LanguageA Multilingual Semantic Wiki Based on Controlled Natural Language
A Multilingual Semantic Wiki Based on Controlled Natural Language
 
Citation Graph Analysis to Identify Memes in Scientific Literature
Citation Graph Analysis to Identify Memes in Scientific LiteratureCitation Graph Analysis to Identify Memes in Scientific Literature
Citation Graph Analysis to Identify Memes in Scientific Literature
 
Citation Graph Analysis to Identify Memes in Scientific Literature
Citation Graph Analysis to Identify Memes in Scientific LiteratureCitation Graph Analysis to Identify Memes in Scientific Literature
Citation Graph Analysis to Identify Memes in Scientific Literature
 
Trusty URIs: Verifiable, Immutable, and Permanent Digital Artifacts for Linke...
Trusty URIs: Verifiable, Immutable, and Permanent Digital Artifacts for Linke...Trusty URIs: Verifiable, Immutable, and Permanent Digital Artifacts for Linke...
Trusty URIs: Verifiable, Immutable, and Permanent Digital Artifacts for Linke...
 
Automatische Übersetzung in einem multilingualen, semantischen Wiki
Automatische Übersetzung in einem multilingualen, semantischen WikiAutomatische Übersetzung in einem multilingualen, semantischen Wiki
Automatische Übersetzung in einem multilingualen, semantischen Wiki
 
A Multilingual Semantic Wiki based on Attempto Controlled English and Grammat...
A Multilingual Semantic Wiki based on Attempto Controlled English and Grammat...A Multilingual Semantic Wiki based on Attempto Controlled English and Grammat...
A Multilingual Semantic Wiki based on Attempto Controlled English and Grammat...
 
A Multilingual Semantic Wiki based on Attempto Controlled English and Grammat...
A Multilingual Semantic Wiki based on Attempto Controlled English and Grammat...A Multilingual Semantic Wiki based on Attempto Controlled English and Grammat...
A Multilingual Semantic Wiki based on Attempto Controlled English and Grammat...
 
Improving Text Mining with Controlled Natural Language: A Case Study for Prot...
Improving Text Mining with Controlled Natural Language: A Case Study for Prot...Improving Text Mining with Controlled Natural Language: A Case Study for Prot...
Improving Text Mining with Controlled Natural Language: A Case Study for Prot...
 
AceRules: Executing Rules in Controlled Natural Language
AceRules: Executing Rules in Controlled Natural LanguageAceRules: Executing Rules in Controlled Natural Language
AceRules: Executing Rules in Controlled Natural Language
 
AceWiki: A Natural and Expressive Semantic Wiki
AceWiki: A Natural and Expressive Semantic WikiAceWiki: A Natural and Expressive Semantic Wiki
AceWiki: A Natural and Expressive Semantic Wiki
 
AceWiki: Controlled English in a Semantic Wiki
AceWiki: Controlled English in a Semantic WikiAceWiki: Controlled English in a Semantic Wiki
AceWiki: Controlled English in a Semantic Wiki
 
How Controlled English can Improve Semantic Wikis
How Controlled English can Improve Semantic WikisHow Controlled English can Improve Semantic Wikis
How Controlled English can Improve Semantic Wikis
 
How to Evaluate Controlled Natural Languages
How to Evaluate Controlled Natural LanguagesHow to Evaluate Controlled Natural Languages
How to Evaluate Controlled Natural Languages
 

Wissensrepräsentation in kontrolliertem Englisch

  • 1. Wissensrepräsentation in kontrolliertem Englisch Tobias Kuhn Institut für Informatik & Institut für Computerlinguistik Universität Zürich Mercator-Preis 22. September 2009 ???? ?? ?? ?
  • 2. Tobias Kuhn, Mercator-Preis 2009, Universität Zürich 2 Problem  Das World Wide Web enthält Unmengen von Informationen, wovon der Grossteil in natürlicher Sprache verfasst ist  Automatisches Verstehen natürlicher Sprache durch Computer ist ein ungelöstes Problem trotz jahrzehntelanger Forschung  Folgen:  Nur Stichwort-basierte Suche  Keine automatische Beantwortung von Fragen  Keine “intelligenten” Programme, die das Wissen aus dem Web anwenden
  • 3. Tobias Kuhn, Mercator-Preis 2009, Universität Zürich 3 Problem: Beispiel  Die Frage kann nicht automatisch beantwortet werden, obwohl die nötige Information vorhanden ist “Welche Städte in einem Binnenland haben mindestens zwei Universitäten?”
  • 4. Tobias Kuhn, Mercator-Preis 2009, Universität Zürich 4 Mögliche Lösung: formale Wissensrepräsentation  Idee: die Information wird nicht in natürlicher Sprache sondern in einer formalen, Logik-basierten Sprache repräsentiert:  Sogenannte “Reasoner” können dann verschiedene Probleme automatisch lösen:  Konsistenzprüfung: Gibt es irgendwo einen Widerspruch?  Antworten zu einer Frage fnden  Beweise führen  Problem: Die Logiknotationen sind schwierig zu verstehen ohne spezifsche Ausbildung ∀X(country(X) ⋀ –∃Y(sea(Y) ⋀ border(X,Y)) → landlocked(X))
  • 5. Tobias Kuhn, Mercator-Preis 2009, Universität Zürich 5 Natürliche und formale Sprachen Countries that border no sea are landlocked countries. ∀X(country(X) ⋀ –∃Y(sea(Y) ⋀ border(X,Y) ) → landlocked(X) )
  • 6. Tobias Kuhn, Mercator-Preis 2009, Universität Zürich 6 Kontrollierte natürliche Sprachen  Kontrollierte natürliche Sprachen sind Teilmengen von natürlichen Sprachen  Formale Sprachen, die natürlich aussehen  Vereinen die intuitive Verständlichkeit natürlicher Sprachen mit der Exaktheit formaler Sprachen  Sollen die Kommunikation zwischen Mensch und Computer verbessern  Direkte Verbindung zu formaler Logik  Beispiel: Attempto Controlled English (ACE) ∀X(country(X) ⋀ –∃Y(sea(Y) ⋀ border(X,Y)) → landlocked(X)) Every country that borders no sea is a landlocked country.
  • 7. Tobias Kuhn, Mercator-Preis 2009, Universität Zürich 7 Kontrollierte natürliche Sprache Every country that borders no sea is a landlocked country. ∀X(country(X) ⋀ –∃Y(sea(Y) ⋀ border(X,Y) ) → landlocked(X) )
  • 8. Tobias Kuhn, Mercator-Preis 2009, Universität Zürich 8 AceWiki  AceWiki ist ein Wiki (wie z.B. Wikipedia)  Artikel in AceWiki sind in ACE geschrieben, wodurch deren Inhalt automatisch in Logik übersetzt werden kann  Ein “Reasoner” ist integriert:  Konsistenzprüfung  Beantwortung von Fragen (formuliert in ACE)  Extraktion von Wort-Hierarchien  Spezieller Editor um syntaktisch korrekte ACE Sätze zu erstellen
  • 9. Tobias Kuhn, Mercator-Preis 2009, Universität Zürich 9 AceWiki
  • 10. Tobias Kuhn, Mercator-Preis 2009, Universität Zürich 10 Beispielfrage in AceWiki
  • 11. Tobias Kuhn, Mercator-Preis 2009, Universität Zürich 11 Vorausschauender Editor
  • 12. Tobias Kuhn, Mercator-Preis 2009, Universität Zürich 12 Evaluation  Experimentelle Verständlichkeits-Evaluation von ACE und einer anderen Logik-Sprache  Aufgabe: Klassifkation von Aussagen als wahr/falsch  Resultat: ACE wurde besser verstanden, benötigte weniger Lernzeit und wurde von den Subjekten bevorzugt!  Zwei kleine Experimente zur Benutzbarkeit von AceWiki  Aufgabe: Erstellung einer Wissensbasis mit AceWiki  Resultat:  Ca. 80% der Aussagen waren korrekt und sinnvoll  Die Subjekte fügten alle 5–6 Minuten eine korrekte und sinnvolle Aussage hinzu
  • 13. Tobias Kuhn, Mercator-Preis 2009, Universität Zürich 13 Fazit  Kontrollierte natürliche Sprache …  … kann die Kluft überbrücken zwischen Menschen, die in natürlicher Sprache kommunizieren, und Computern, die nur formale Sprachen verstehen.  ... ermöglicht den einfachen und intuitiven Umgang mit formalen Wissensrepräsentationen.
  • 14. Tobias Kuhn, Mercator-Preis 2009, Universität Zürich 14 Vielen Dank für Ihre Aufmerksamkeit! ❤❤❤❤ ❤❤ ❤❤ ❤