Was tun wenn Ihre Bank zusammenbricht?        Semantische Verfahren zum Dokumentenverstehen                               ...
Semantische Methoden zum Dokumentenverstehen1. Das Problem2. Was ist Semantik ?3. Methoden der Semantik4. Technologischer ...
Was tun, wenn die Bank zusammenbricht?   Schritt 1: Inhalt verstehen – Semantische Bedeutung   Schritt 2: Angemessene Ak...
Homonyme und Polysemie   Die Sprache ist mehrdeutig       Ein Wort steht für verschiedene Bedeutungsinhalte   Bank:    ...
Disambiguierung   Auflösung der Mehrdeutigkeit       Nötig um den Inhalt zu verstehen       Nötig um automatische Entsc...
Disambiguierung   Syntax:       Definiert die Struktur einer Sprache und die Bedeutung der Worte im Satz       Kann dam...
Bedeutungsanalyse   Semantik       Beschreibt die Bedeutung von sprachlichen Zeichen       Für Dokumentenverstehen die ...
Kontext   Pragmatik       Bedeutung in Abhängigkeit zur konkreten Situation       Der Kontext des Sprechers (Schreibers...
Dokumentenverstehen   Automatische Indexierung   Erzeugung von strukturierter Information aus unstrukturierten Daten   ...
Regelbasierte Klassifikation und Extraktion   Aufwendig einzurichten   Pflegeintensiv   Funktioniert nur für wenig komp...
Statistische Klassifikation und Extraktion   Funktioniert nur bis zu einem gewissen Grad   Ausnahmen können nicht gehand...
Fazit: Semantik ist nötig   Echtes Dokumentenverstehen   Nachbildung der menschlichen kognitiven Fähigkeiten   Funktion...
Vielen Dank für Ihre Aufmerksamkeit          Alexander Goerke          ABBYY          goerke@abbyy.com          www.abbyy....
Shī Shì shí shī shǐ…Chinesisch         Pinyin                              Deutsch  施氏食獅史            „Shī Shì shí shī shǐ“...
Das Video zum Vortrag sowie weitere Informationen gibt es unter: http://ecm-navigator.de/termine/was-tun-wenn-ihre-bank-zu...
Nächste SlideShare
Wird geladen in …5
×

Was tun, wenn Ihre Bank zusammenbricht?

485 Aufrufe

Veröffentlicht am

Vortrag des BITKOM Arbeitksreis Document & Data Capture auf dem BITKOM ECM Solutions Park zur DMS Expo 2012.

Referent: Dr. Alexander Görke, Vice President Semantic Technology Products "ABBYY

0 Kommentare
0 Gefällt mir
Statistik
Notizen
  • Als Erste(r) kommentieren

  • Gehören Sie zu den Ersten, denen das gefällt!

Keine Downloads
Aufrufe
Aufrufe insgesamt
485
Auf SlideShare
0
Aus Einbettungen
0
Anzahl an Einbettungen
14
Aktionen
Geteilt
0
Downloads
2
Kommentare
0
Gefällt mir
0
Einbettungen 0
Keine Einbettungen

Keine Notizen für die Folie

Was tun, wenn Ihre Bank zusammenbricht?

  1. 1. Was tun wenn Ihre Bank zusammenbricht? Semantische Verfahren zum Dokumentenverstehen Alexander Goerke, ABBYY Stuttgart, 24.10.2012J
  2. 2. Semantische Methoden zum Dokumentenverstehen1. Das Problem2. Was ist Semantik ?3. Methoden der Semantik4. Technologischer Hintergrund5. Anwendungen 2
  3. 3. Was tun, wenn die Bank zusammenbricht? Schritt 1: Inhalt verstehen – Semantische Bedeutung Schritt 2: Angemessene Aktion planen 3
  4. 4. Homonyme und Polysemie Die Sprache ist mehrdeutig  Ein Wort steht für verschiedene Bedeutungsinhalte Bank: English:  Sitzmöbel • a financial institution  Finanzinstitution • the building where a financial institution offers services Weitere Beispiele • a synonym for rely upon (e.g. "Im  Läufer your friend, you can bank on me")  Flügel • a river bank is a homonym. It is a completely different meaning.  Schlag  Zug  Feder 4
  5. 5. Disambiguierung Auflösung der Mehrdeutigkeit  Nötig um den Inhalt zu verstehen  Nötig um automatische Entscheidungen fällen zu können Stufenweise Analyse durch  Syntax  Semantik  Pragmatik 5
  6. 6. Disambiguierung Syntax:  Definiert die Struktur einer Sprache und die Bedeutung der Worte im Satz  Kann damit Mehrdeutigkeiten auflösen  „Strauss“, sagte Kohl „wird niemals Kanzler werden.“  Strauss sagte: „Kohl wird niemals Kanzler werden.“  „Weine nicht, sagte sie“. <-> „Ich mag diese Weine nicht, sagte sie“  Analyse: 6
  7. 7. Bedeutungsanalyse Semantik  Beschreibt die Bedeutung von sprachlichen Zeichen  Für Dokumentenverstehen die Bedeutung von Wörtern  Bedeutung kann anhand eines Lexikalischen und Semantischen Baums bestimmt werden Beispiel Bank:  Ich sitze auf die Bank –  Ich gehe auf die Bank –  Durch die Bank positiv.. – Images courtesy of Master isolated images, adamr, nuttakit/ FreeDigitalPhotos.net 7
  8. 8. Kontext Pragmatik  Bedeutung in Abhängigkeit zur konkreten Situation  Der Kontext des Sprechers (Schreibers) und des Hörers (Lesers) ist entscheidend Beispiel  Schlag zu!  „Weißt Du wie viel Uhr es ist?“ – „Viertel vor!“ Geschäftskorrespondenz  „Warten Sie mit der Ausführung noch bis morgen“  Banktransfer? Kaufvertrag? Export? Beschluss? 8
  9. 9. Dokumentenverstehen Automatische Indexierung Erzeugung von strukturierter Information aus unstrukturierten Daten Benötigt für Big Data und Business Analytics Automatisches Routing im Workflow basierend auf Inhalt Automatische Entscheidungen und Antworten Bisher hauptsächlich manuelle Tätigkeiten Zu teuer, inkonsistent und schlicht nicht mehr möglich Automatische Systeme sind nötig 9
  10. 10. Regelbasierte Klassifikation und Extraktion Aufwendig einzurichten Pflegeintensiv Funktioniert nur für wenig komplexe Systeme Kann Ambiguitäten nicht auflösen 10
  11. 11. Statistische Klassifikation und Extraktion Funktioniert nur bis zu einem gewissen Grad Ausnahmen können nicht gehandhabt werden Sehr anfällig für mehrdeutige Begriffe  „Wir müssen sie feuern“  „Wir müssen sie anfeuern“ Unbefriedigend bei kurzen Texten  SMS und Nachrichtendienste  Soziale Medien Texte mit mehreren Themen (Multitopic) sind problematisch Negationen werden ignoriert  „Bitte senden Sie mir kein weiteres Angebot zu.“  „Ihrer Argumentation bezüglich Thema 1 und Thema 2 stimmen wir nicht zu.“ 11
  12. 12. Fazit: Semantik ist nötig Echtes Dokumentenverstehen Nachbildung der menschlichen kognitiven Fähigkeiten Funktionen  Wörter werden in ihrer Bedeutung erkannt  Einengung – Homonyme disambiguieren  Verbreiterung – Nach Bedeutungen suchen  Für Klassifikation  Für Extraktion  Für Suche  Entitäten und Fakten werden extrahiert  Themen werden erkannt Mit der Compreno Technologie kann ABBYY unstrukturierten Text so verstehen, dass Geschäftsprozesse komplett automatisiert werden können. 12
  13. 13. Vielen Dank für Ihre Aufmerksamkeit Alexander Goerke ABBYY goerke@abbyy.com www.abbyy.com www.ecm-navigator.de www.bitkom.org/ecm
  14. 14. Shī Shì shí shī shǐ…Chinesisch Pinyin Deutsch 施氏食獅史 „Shī Shì shí shī shǐ“ „Die Geschichte des Shi, der Löwen isst“石室詩士施氏,嗜獅 Shíshì shīshi Shī Shì, shì shī, Steinhöhlendichter Shi, süchtig nach Löwen, schwört,,誓食十獅。 shì shí shí shī. zehn Löwen zu essen.氏時時適市視獅。 Shì shíshí shì shì shì shī. Oft geht er auf den Markt, um Löwen zu sichten.十時,適十獅適市。 Shí shí, shì shí shī shì shì. Um zehn Uhr passieren gerade zehn Löwen den Markt.是時,適施氏適市。 Shì shí, shì Shī Shì shì shì. Zu dieser Zeit passiert auch Shi gerade den Markt.氏視是十獅,恃矢勢 Shì shì shì shí shī, shì shǐ shì, Er sieht die zehn Löwen, kraft seiner Pfeile schickt er,使是十獅逝世。 shǐ shì shí shī shìshì. die zehn Löwen in den Tod.氏拾是十獅屍,適石 Shì shí shì shí shī shī, shì Er bringt die zehn Löwenleichen zur室。 shíshì. Steinhöhle.石室濕,氏使侍拭石 Shíshì shī, Shì shǐ shì shì Die Steinhöhle ist feucht. Er befiehlt seinem Diener,室。 shíshì. diese abzutrocknen.石室拭,氏始試食是 Shíshì shì, Shì shǐ shì shí shì Nachdem die Steinhöhle abgetrocknet worden ist,十獅。 shí shī. versucht er, die zehn Löwen zu essen.食時,始識是十獅, Shí shí, shǐ shí shì shí shī, shí Beim Essen merkt er, dass diese zehn Löwen eigentlich實十石獅屍。 shí shí shī shī. zehn Steinlöwenleichen sind.試釋是事。 Shì shì shì shì. Versuche dies zu erklären. 14
  15. 15. Das Video zum Vortrag sowie weitere Informationen gibt es unter: http://ecm-navigator.de/termine/was-tun-wenn-ihre-bank-zusammenbricht-warum-das- verstehen-von Vortrag auf dem Forum des BITKOM ECM Solutions Park zur DMS Expo 2012 25. Oktober 2012, 11:00-11:30 Uhr 1

×