SlideShare ist ein Scribd-Unternehmen logo
1 von 19
Ich spreche mit dir,
doch du nicht mit mir

Semantische Herausforderungen
elektronischen Datenaustauschs




                                                                           Johann Höchtl

                                                         Donau Universität Krems
                                                       Zentrum für E-Government
Forschungskongress    Lange Nacht der Forschung 2009   © 2009 Johann Höchtl, Donau Universität Krems
Die große Verwirrung



                     Pieter Breugel, der Ältere:Der Turmbau zu Babel -
                         1563, im Kunsthistorischen Museum in Wien




Forschungskongress                                                       Lange Nacht der Forschung 2009   © 2009 Johann Höchtl, Donau Universität Krems
Was ist Semantik?
      • Chinesische Schriftzeichen
              – Unterschiedliche Aussprache
              – Eine gemeinsame semantische Bedeutung
      • ChinesInnen können sich vielleicht nicht gemeinsam unterhalten
        (sprechen), aber sie können die selbe Zeitung lesen
 Semantik – Über die Bedeutung von „Zeichen“; Nicht nur
   Schrift-zeichen, sondern alles was „begriffen“ werden kann




                                                                                                                    © /cocoarmani@Flickr
Natalie Behring-Chisholm/Getty Images für Life Magazine
Forschungskongress                                        Lange Nacht der Forschung 2009   © 2009 Johann Höchtl, Donau Universität Krems
Sprachprobleme

                     Unsere Weine lassen nichts zu wünschen übrig!
                     “Our wines leave you nothing to hope for”
                     Bei unseren Weinen besteht keine Hoffnung !?

                     Wir versenden Ihr Gepäck überall hin!
                     “We take your Bags and send them in all directions”
                      Wir nehmen Ihre Koffer und verschicken sie
                      in alle Richtungen !?




                                                                                                   The Beatles:Magical Mystery Tour (1967)
                                                      I say hello
                                                    Hello, hello
                               I don't know why you say goodbye
                                                     I say hello
Forschungskongress                 Lange Nacht der Forschung 2009   © 2009 Johann Höchtl, Donau Universität Krems
Brücken

                                                                        Konzepte.Verbinden
                                Brücken
                                                                        Weizen vs. Reis
                                                                        Rotwein vs. Sake
                                               Istanbul                 Surströmming vs.
                                                                           Tausenjährige Eier

                                                                        Lederhosen vs. Sari

             Europa                         Asien                       Bachblüten vs. Reiki
                                                                        .
                                                                        .




     Map by Openstreetmap.org


Forschungskongress                    Lange Nacht der Forschung 2009   © 2009 Johann Höchtl, Donau Universität Krems
Super / Sub - Concepts
    Weizen vs. Reis
    Rotwein vs. Sake                                                  Essen
    Surströmming vs.
       Tausendjährige Eier                      Kohlenhydrate
                                                        Alkohol                   Natürlich konserviert
                                                                    Bekleidung
    Lederhosen vs. Sari
                                                            Natürliche Materialien
                                                                    Medizin
    Bachblüten vs. Reiki
                                                         Alternative Medizin
                     Finanz    kaufen

                        Logistik   lagern                          Experte in “eh-Alles”
                                                                            vs.
    Superconcept / Higher Ontology                              bereichspezifisches Wissen

   Sub-Concept / Lower Ontology
Forschungskongress                          Lange Nacht der Forschung 2009    © 2009 Johann Höchtl, Donau Universität Krems
Wer wir sind und was wir tun

     • Zentrum für E-Government
            – Vereinfachung von Abläufen innerhalb und zwischen
              behördlichen Institutionen sowie zu Bürgern, der Wirtschaft,
              … , unter Einsatz von Informations- und
              Kommunikationstechniken.
     • Forschungsschwerpunkt: Elektronische Beteiligung im
       Administrations- und Gesetzgebungsprozess und die
       Auswirkungen auf die Gesellschaft
            – www.donau-uni.ac.at/egov/
            – http://digitalgovernment.wordpress.com
            – Journal of E-Democrcy and Open Government
              http://www.jedem.org

Forschungskongress               Lange Nacht der Forschung 2009   © 2009 Johann Höchtl, Donau Universität Krems
Warum ist E-Kooperation
                                        notwendig für E-Government?
     • Zuerst: Was sind die Funktionen des „Government“?
            – Staatliche Aufgaben wahrnehmen
            – Prämissen der Aufgabenerfüllung: effektiv, effizient, sparsam,
              zweckmäßig, verhältnismäßig
     • Letztendlich geht es darum, Österreich als lebenswerten und
       zukunftstauglichen Staat zu erhalten
            – unter rechtlichen, … , Einschränkungen (Innerstaatlich, EU)
     • Treiber ist Konvergenz vieler Faktoren
            – Fall der physischen Mauer(n) (Berliner Mauer)
            – Fall der virtuellen Mauern (Zölle, Handelsbeschränkungen)
            – Fall der Preise für elektronische Kommunikation (Speicher,
              Geschwindigkeit
     • Ergebnis: wirtschaftliche Zusammenarbeit geprägt von globalem
       Denken und Handeln


Forschungskongress                    Lange Nacht der Forschung 2009   © 2009 Johann Höchtl, Donau Universität Krems
E-Zusammenarbeit: Warum tut sich
                                   ein Staat schwer(er) dabei?
     • Staat ist Monopolist
            – In vielen Bereichen konkurrenzlos, daher keine
              Notwendigkeit zu wettbewerbsorientierten agieren
            – Jurisdiktion, Grunderwerb, Heirat, (Firmengründung),
              (Straßenbau), [Telekomunikationsnetzwerke]
     • staatliche Hoheit als „sicherer Hafen“
            – Überbetonung hegemonialen Handelns: Sicherheitszölle
     • + innerstaatliche Souveränität (Föderalismus)
            – fördert Vielfalt – aber
            – staatliche Strukturen folgen nur sehr langsam den geänderten
              Rahmenbedingungen
     • Idee: Privatisierung!
            – New Public Management, Reagan/Thatcher ~ 1980
Forschungskongress               Lange Nacht der Forschung 2009   © 2009 Johann Höchtl, Donau Universität Krems
E-Zusammenarbeit: Voraussetzung
                         gegenseitiges „Verstehen“




                                                          http://healthbase.netbase.com
Forschungskongress   Lange Nacht der Forschung 2009   © 2009 Johann Höchtl, Donau Universität Krems
E-Zusammenarbeit: Voraussetzung
                         gegenseitiges „Verstehen“
                          “The tragi-comic failure of Netbase can teach a lot to every
                              company in the Semantic space.”
                          Lesson 1: Don’t even try to boil the ocean of the WWW
                              with these technologies. [The] Internet is full of
                              valuable information but crap (or opinions) is 90% [of
      Reddit:                 it] , the cost of getting rid of this crap and save only the
                              good stuff is very high
                          Lesson 2: Linguistic approaches are likely going to fail
                              because search engines (and machines) can’t
                              distinguish joke/seriousness, sarcasm/shame and
                              sentiments in general. The semantic meaning is right
                              there not in the words of a text.
                          Lesson 3: If you choose to apply such approaches to one
                              specific topic like Medicine (good choice) then stick to
                              that topic , that means accept as INPUT only medical
                              terms and provide as OUTPUTS only medical terms.
                          This last point requires human intervention and predefined
                              taxonomies/ontologies but Netbase claims that they
                              don’t need them both, ]i.e., that] their engine is fully
                              automatic the failure too.”



                           Source: http://marklogic.blogspot.com/2009/09/netbase-
                           tragicomedy-perils-of-magic-and.html

Forschungskongress   Lange Nacht der Forschung 2009       © 2009 Johann Höchtl, Donau Universität Krems
Ähnlichkeitsprobleme

     • Wie kann ein Computersystem zwei Konzepte als “ähnlich”
       erkennen?
     • Ausgangspunkt: Transformation in etwas “Berechenbares”
            – Computer können nur mit „Zahlen“ umgehen
            – Die geeignete Datenstruktur ist die Matrix, X and Y-Dimension enthalten
              identifizierte Konzepte und ihre Ähnlichkeit zueinander
            – Visualisierung als Baum oder gerichtete, azyklische Graphen
     • Rechenaufwand ist sehr hoch!
            – Zwei Dokumente vergleichen: Jedes Wort mit jedem Wort vergleichen
            – Treiber: Bio-Medizin!
            – Neue Methoden aus der Genetik: Gensequenzierung
     • Der Mensch ist im Erkennen von Ähnlichkeiten und
       Mustern unübertroffen!
Forschungskongress                   Lange Nacht der Forschung 2009   © 2009 Johann Höchtl, Donau Universität Krems
Arten von Ähnlichkeiten

     • Strukturelle Ähnlichkeit
            – „Was ähnlich Aussieht, ist auch
              ähnlich“

     • Element-basierte Ähnlichkeit
            – „Was ähnlich heißt, ist auch ähnlich“
                                             ZielFlughafen                       ZielFlghafen
     • Möglichkeiten um Ähnlichkeiten (computerbasiert)
       festzustellen
            – Ähnliche Schreibweise
            – Ähnlicher „Klang“ (Aussprache)
     • Problem!          Sprache!!!
            – Was ähnlich „kling“, muss nicht ähnliche Bedeutung haben
Forschungskongress               Lange Nacht der Forschung 2009   © 2009 Johann Höchtl, Donau Universität Krems
Dem Computer „Verständnis“ beibringen

     • Computer können nicht denken und selbsttätig
       Schlüsse ziehen
            – „Eine Frage der Erziehung“
            – Verstehen: Begriffe („Wörtern“) Gewichte bezüglich Ihrer
              Verwandtschaft untereinander (zu)ordnen
            – In riesigen Datenbanken (vor allem für Englisch) sind diese
              Verwandtschaftsbeziehungen abgelegt.
     • ABER: Abkürzungen, Kunstworte (AnkunftsZeitA,
       AnkunftsZeitB) Suffixe/Präfixe (hatName), fehlerhafte
       Wörter, frei erfundene Wörter lassen keine
       automatisierte Verarbeitung zu.
            – Eingriff des Menschen ist notwendig
Forschungskongress                Lange Nacht der Forschung 2009   © 2009 Johann Höchtl, Donau Universität Krems
Beispiel: Das Auto und seine Verwandten


                 Quelle: www.Opencyc.org




Forschungskongress                               Lange Nacht der Forschung 2009   © 2009 Johann Höchtl, Donau Universität Krems
Anwendungen computerunterstützen
                     semantischen Verstehens im E-Government




Forschungskongress        Lange Nacht der Forschung 2009   © 2009 Johann Höchtl, Donau Universität Krems
Unsere Station: N – A18




Forschungskongress   Lange Nacht der Forschung 2009   © 2009 Johann Höchtl, Donau Universität Krems
Danke für die Aufmerksamkeit!




  Unser Stand: N - A18
  1. Stock


Forschungskongress   Lange Nacht der Forschung 2009   © 2009 Johann Höchtl, Donau Universität Krems
Links


     • Gerti Kappel, Horst Kargl, Gerhard Kramler, Andrea
       Schauerhuber, Martina Seidl, Michael Strommer, and Manuel
       Wimmer, “Matching Metamodels with Semantic Systems - An
       Experience Report,” Mainz, 2007, pp. 38-52.
     • Fabien Duchateau and Zohra Bellahsène, “Designing a
       Benchmark for the Assessment of XML Schema Matching Tools,”
       Vienna, Austria: ACM, 2007.
     • Hong-Hai Do and Erhard Rahm, “Matching large schemas:
       Approaches and evaluation,” Science Direct, 2007, pp. 857-885.
     • www.opencyc.org
     • http://www.w3.org/2001/sw/



Forschungskongress           Lange Nacht der Forschung 2009    © 2009 Johann Höchtl, Donau Universität Krems

Weitere ähnliche Inhalte

Mehr von Johann Höchtl

Homomorphic encryption on Blockchain Principles
Homomorphic encryption on Blockchain PrinciplesHomomorphic encryption on Blockchain Principles
Homomorphic encryption on Blockchain PrinciplesJohann Höchtl
 
Datenqualität auf Offenen Datenportalen
Datenqualität auf Offenen DatenportalenDatenqualität auf Offenen Datenportalen
Datenqualität auf Offenen DatenportalenJohann Höchtl
 
ADV FIWARE Workshop starring Docker and Virtualisation
ADV FIWARE Workshop starring Docker and VirtualisationADV FIWARE Workshop starring Docker and Virtualisation
ADV FIWARE Workshop starring Docker and VirtualisationJohann Höchtl
 
Projektbeschreibung ADEQUATe
Projektbeschreibung ADEQUATeProjektbeschreibung ADEQUATe
Projektbeschreibung ADEQUATeJohann Höchtl
 
Institutionalising open data quality - Processes Standards, Tools
Institutionalising open data quality - Processes Standards, ToolsInstitutionalising open data quality - Processes Standards, Tools
Institutionalising open data quality - Processes Standards, ToolsJohann Höchtl
 
Offener Haushalt – Transparenz in öffentlichen Haushalten
Offener Haushalt – Transparenz in öffentlichen HaushaltenOffener Haushalt – Transparenz in öffentlichen Haushalten
Offener Haushalt – Transparenz in öffentlichen HaushaltenJohann Höchtl
 
Datenqualität von Datenportalen
Datenqualität von DatenportalenDatenqualität von Datenportalen
Datenqualität von DatenportalenJohann Höchtl
 
Open Government Data & offene Wirtschaftsdaten - Two of a Kind?
Open Government Data & offene Wirtschaftsdaten - Two of a Kind?Open Government Data & offene Wirtschaftsdaten - Two of a Kind?
Open Government Data & offene Wirtschaftsdaten - Two of a Kind?Johann Höchtl
 
Elektronische Literaturverwaltung mit Zotero
Elektronische Literaturverwaltung mit ZoteroElektronische Literaturverwaltung mit Zotero
Elektronische Literaturverwaltung mit ZoteroJohann Höchtl
 
The Case of opendataportal.at
The Case of opendataportal.atThe Case of opendataportal.at
The Case of opendataportal.atJohann Höchtl
 
From E-Government to Open Government
From E-Government to Open GovernmentFrom E-Government to Open Government
From E-Government to Open GovernmentJohann Höchtl
 
Smart Cities and Smart ICT
Smart Cities and Smart ICTSmart Cities and Smart ICT
Smart Cities and Smart ICTJohann Höchtl
 
Evaluation of Open Government Data Implementation of City of Vienna
Evaluation of Open Government Data Implementation of City of ViennaEvaluation of Open Government Data Implementation of City of Vienna
Evaluation of Open Government Data Implementation of City of ViennaJohann Höchtl
 
Smart Cities, Smart Regions and the Role of Open Data
Smart Cities, Smart Regions and the Role of Open DataSmart Cities, Smart Regions and the Role of Open Data
Smart Cities, Smart Regions and the Role of Open DataJohann Höchtl
 
OGD for Culture and Art
OGD for Culture and ArtOGD for Culture and Art
OGD for Culture and ArtJohann Höchtl
 
Open Government Data DCAT Application Profile
Open Government Data DCAT Application ProfileOpen Government Data DCAT Application Profile
Open Government Data DCAT Application ProfileJohann Höchtl
 
Semantischer Datenaustausch - Ich spreche mit dir, doch du nicht mit mir
Semantischer Datenaustausch - Ich spreche mit dir, doch du nicht mit mirSemantischer Datenaustausch - Ich spreche mit dir, doch du nicht mit mir
Semantischer Datenaustausch - Ich spreche mit dir, doch du nicht mit mirJohann Höchtl
 
Open Government Data - Security Risk or mean for Threat Prevention
Open Government Data - Security Risk or mean for Threat PreventionOpen Government Data - Security Risk or mean for Threat Prevention
Open Government Data - Security Risk or mean for Threat PreventionJohann Höchtl
 

Mehr von Johann Höchtl (20)

Homomorphic encryption on Blockchain Principles
Homomorphic encryption on Blockchain PrinciplesHomomorphic encryption on Blockchain Principles
Homomorphic encryption on Blockchain Principles
 
Datenqualität auf Offenen Datenportalen
Datenqualität auf Offenen DatenportalenDatenqualität auf Offenen Datenportalen
Datenqualität auf Offenen Datenportalen
 
ADV FIWARE Workshop starring Docker and Virtualisation
ADV FIWARE Workshop starring Docker and VirtualisationADV FIWARE Workshop starring Docker and Virtualisation
ADV FIWARE Workshop starring Docker and Virtualisation
 
Projektbeschreibung ADEQUATe
Projektbeschreibung ADEQUATeProjektbeschreibung ADEQUATe
Projektbeschreibung ADEQUATe
 
Institutionalising open data quality - Processes Standards, Tools
Institutionalising open data quality - Processes Standards, ToolsInstitutionalising open data quality - Processes Standards, Tools
Institutionalising open data quality - Processes Standards, Tools
 
Yound Coders Festival
Yound Coders FestivalYound Coders Festival
Yound Coders Festival
 
Sind wir schon da?!
Sind wir schon da?!Sind wir schon da?!
Sind wir schon da?!
 
Offener Haushalt – Transparenz in öffentlichen Haushalten
Offener Haushalt – Transparenz in öffentlichen HaushaltenOffener Haushalt – Transparenz in öffentlichen Haushalten
Offener Haushalt – Transparenz in öffentlichen Haushalten
 
Datenqualität von Datenportalen
Datenqualität von DatenportalenDatenqualität von Datenportalen
Datenqualität von Datenportalen
 
Open Government Data & offene Wirtschaftsdaten - Two of a Kind?
Open Government Data & offene Wirtschaftsdaten - Two of a Kind?Open Government Data & offene Wirtschaftsdaten - Two of a Kind?
Open Government Data & offene Wirtschaftsdaten - Two of a Kind?
 
Elektronische Literaturverwaltung mit Zotero
Elektronische Literaturverwaltung mit ZoteroElektronische Literaturverwaltung mit Zotero
Elektronische Literaturverwaltung mit Zotero
 
The Case of opendataportal.at
The Case of opendataportal.atThe Case of opendataportal.at
The Case of opendataportal.at
 
From E-Government to Open Government
From E-Government to Open GovernmentFrom E-Government to Open Government
From E-Government to Open Government
 
Smart Cities and Smart ICT
Smart Cities and Smart ICTSmart Cities and Smart ICT
Smart Cities and Smart ICT
 
Evaluation of Open Government Data Implementation of City of Vienna
Evaluation of Open Government Data Implementation of City of ViennaEvaluation of Open Government Data Implementation of City of Vienna
Evaluation of Open Government Data Implementation of City of Vienna
 
Smart Cities, Smart Regions and the Role of Open Data
Smart Cities, Smart Regions and the Role of Open DataSmart Cities, Smart Regions and the Role of Open Data
Smart Cities, Smart Regions and the Role of Open Data
 
OGD for Culture and Art
OGD for Culture and ArtOGD for Culture and Art
OGD for Culture and Art
 
Open Government Data DCAT Application Profile
Open Government Data DCAT Application ProfileOpen Government Data DCAT Application Profile
Open Government Data DCAT Application Profile
 
Semantischer Datenaustausch - Ich spreche mit dir, doch du nicht mit mir
Semantischer Datenaustausch - Ich spreche mit dir, doch du nicht mit mirSemantischer Datenaustausch - Ich spreche mit dir, doch du nicht mit mir
Semantischer Datenaustausch - Ich spreche mit dir, doch du nicht mit mir
 
Open Government Data - Security Risk or mean for Threat Prevention
Open Government Data - Security Risk or mean for Threat PreventionOpen Government Data - Security Risk or mean for Threat Prevention
Open Government Data - Security Risk or mean for Threat Prevention
 

Semantische Herausforderungen elektronischen Datenaustauschs

  • 1. Ich spreche mit dir, doch du nicht mit mir Semantische Herausforderungen elektronischen Datenaustauschs Johann Höchtl Donau Universität Krems Zentrum für E-Government Forschungskongress Lange Nacht der Forschung 2009 © 2009 Johann Höchtl, Donau Universität Krems
  • 2. Die große Verwirrung Pieter Breugel, der Ältere:Der Turmbau zu Babel - 1563, im Kunsthistorischen Museum in Wien Forschungskongress Lange Nacht der Forschung 2009 © 2009 Johann Höchtl, Donau Universität Krems
  • 3. Was ist Semantik? • Chinesische Schriftzeichen – Unterschiedliche Aussprache – Eine gemeinsame semantische Bedeutung • ChinesInnen können sich vielleicht nicht gemeinsam unterhalten (sprechen), aber sie können die selbe Zeitung lesen Semantik – Über die Bedeutung von „Zeichen“; Nicht nur Schrift-zeichen, sondern alles was „begriffen“ werden kann © /cocoarmani@Flickr Natalie Behring-Chisholm/Getty Images für Life Magazine Forschungskongress Lange Nacht der Forschung 2009 © 2009 Johann Höchtl, Donau Universität Krems
  • 4. Sprachprobleme Unsere Weine lassen nichts zu wünschen übrig! “Our wines leave you nothing to hope for” Bei unseren Weinen besteht keine Hoffnung !? Wir versenden Ihr Gepäck überall hin! “We take your Bags and send them in all directions” Wir nehmen Ihre Koffer und verschicken sie in alle Richtungen !? The Beatles:Magical Mystery Tour (1967) I say hello Hello, hello I don't know why you say goodbye I say hello Forschungskongress Lange Nacht der Forschung 2009 © 2009 Johann Höchtl, Donau Universität Krems
  • 5. Brücken Konzepte.Verbinden Brücken Weizen vs. Reis Rotwein vs. Sake Istanbul Surströmming vs. Tausenjährige Eier Lederhosen vs. Sari Europa Asien Bachblüten vs. Reiki . . Map by Openstreetmap.org Forschungskongress Lange Nacht der Forschung 2009 © 2009 Johann Höchtl, Donau Universität Krems
  • 6. Super / Sub - Concepts Weizen vs. Reis Rotwein vs. Sake Essen Surströmming vs. Tausendjährige Eier Kohlenhydrate Alkohol Natürlich konserviert Bekleidung Lederhosen vs. Sari Natürliche Materialien Medizin Bachblüten vs. Reiki Alternative Medizin Finanz kaufen Logistik lagern Experte in “eh-Alles” vs. Superconcept / Higher Ontology bereichspezifisches Wissen Sub-Concept / Lower Ontology Forschungskongress Lange Nacht der Forschung 2009 © 2009 Johann Höchtl, Donau Universität Krems
  • 7. Wer wir sind und was wir tun • Zentrum für E-Government – Vereinfachung von Abläufen innerhalb und zwischen behördlichen Institutionen sowie zu Bürgern, der Wirtschaft, … , unter Einsatz von Informations- und Kommunikationstechniken. • Forschungsschwerpunkt: Elektronische Beteiligung im Administrations- und Gesetzgebungsprozess und die Auswirkungen auf die Gesellschaft – www.donau-uni.ac.at/egov/ – http://digitalgovernment.wordpress.com – Journal of E-Democrcy and Open Government http://www.jedem.org Forschungskongress Lange Nacht der Forschung 2009 © 2009 Johann Höchtl, Donau Universität Krems
  • 8. Warum ist E-Kooperation notwendig für E-Government? • Zuerst: Was sind die Funktionen des „Government“? – Staatliche Aufgaben wahrnehmen – Prämissen der Aufgabenerfüllung: effektiv, effizient, sparsam, zweckmäßig, verhältnismäßig • Letztendlich geht es darum, Österreich als lebenswerten und zukunftstauglichen Staat zu erhalten – unter rechtlichen, … , Einschränkungen (Innerstaatlich, EU) • Treiber ist Konvergenz vieler Faktoren – Fall der physischen Mauer(n) (Berliner Mauer) – Fall der virtuellen Mauern (Zölle, Handelsbeschränkungen) – Fall der Preise für elektronische Kommunikation (Speicher, Geschwindigkeit • Ergebnis: wirtschaftliche Zusammenarbeit geprägt von globalem Denken und Handeln Forschungskongress Lange Nacht der Forschung 2009 © 2009 Johann Höchtl, Donau Universität Krems
  • 9. E-Zusammenarbeit: Warum tut sich ein Staat schwer(er) dabei? • Staat ist Monopolist – In vielen Bereichen konkurrenzlos, daher keine Notwendigkeit zu wettbewerbsorientierten agieren – Jurisdiktion, Grunderwerb, Heirat, (Firmengründung), (Straßenbau), [Telekomunikationsnetzwerke] • staatliche Hoheit als „sicherer Hafen“ – Überbetonung hegemonialen Handelns: Sicherheitszölle • + innerstaatliche Souveränität (Föderalismus) – fördert Vielfalt – aber – staatliche Strukturen folgen nur sehr langsam den geänderten Rahmenbedingungen • Idee: Privatisierung! – New Public Management, Reagan/Thatcher ~ 1980 Forschungskongress Lange Nacht der Forschung 2009 © 2009 Johann Höchtl, Donau Universität Krems
  • 10. E-Zusammenarbeit: Voraussetzung gegenseitiges „Verstehen“ http://healthbase.netbase.com Forschungskongress Lange Nacht der Forschung 2009 © 2009 Johann Höchtl, Donau Universität Krems
  • 11. E-Zusammenarbeit: Voraussetzung gegenseitiges „Verstehen“ “The tragi-comic failure of Netbase can teach a lot to every company in the Semantic space.” Lesson 1: Don’t even try to boil the ocean of the WWW with these technologies. [The] Internet is full of valuable information but crap (or opinions) is 90% [of Reddit: it] , the cost of getting rid of this crap and save only the good stuff is very high Lesson 2: Linguistic approaches are likely going to fail because search engines (and machines) can’t distinguish joke/seriousness, sarcasm/shame and sentiments in general. The semantic meaning is right there not in the words of a text. Lesson 3: If you choose to apply such approaches to one specific topic like Medicine (good choice) then stick to that topic , that means accept as INPUT only medical terms and provide as OUTPUTS only medical terms. This last point requires human intervention and predefined taxonomies/ontologies but Netbase claims that they don’t need them both, ]i.e., that] their engine is fully automatic the failure too.” Source: http://marklogic.blogspot.com/2009/09/netbase- tragicomedy-perils-of-magic-and.html Forschungskongress Lange Nacht der Forschung 2009 © 2009 Johann Höchtl, Donau Universität Krems
  • 12. Ähnlichkeitsprobleme • Wie kann ein Computersystem zwei Konzepte als “ähnlich” erkennen? • Ausgangspunkt: Transformation in etwas “Berechenbares” – Computer können nur mit „Zahlen“ umgehen – Die geeignete Datenstruktur ist die Matrix, X and Y-Dimension enthalten identifizierte Konzepte und ihre Ähnlichkeit zueinander – Visualisierung als Baum oder gerichtete, azyklische Graphen • Rechenaufwand ist sehr hoch! – Zwei Dokumente vergleichen: Jedes Wort mit jedem Wort vergleichen – Treiber: Bio-Medizin! – Neue Methoden aus der Genetik: Gensequenzierung • Der Mensch ist im Erkennen von Ähnlichkeiten und Mustern unübertroffen! Forschungskongress Lange Nacht der Forschung 2009 © 2009 Johann Höchtl, Donau Universität Krems
  • 13. Arten von Ähnlichkeiten • Strukturelle Ähnlichkeit – „Was ähnlich Aussieht, ist auch ähnlich“ • Element-basierte Ähnlichkeit – „Was ähnlich heißt, ist auch ähnlich“ ZielFlughafen  ZielFlghafen • Möglichkeiten um Ähnlichkeiten (computerbasiert) festzustellen – Ähnliche Schreibweise – Ähnlicher „Klang“ (Aussprache) • Problem! Sprache!!! – Was ähnlich „kling“, muss nicht ähnliche Bedeutung haben Forschungskongress Lange Nacht der Forschung 2009 © 2009 Johann Höchtl, Donau Universität Krems
  • 14. Dem Computer „Verständnis“ beibringen • Computer können nicht denken und selbsttätig Schlüsse ziehen – „Eine Frage der Erziehung“ – Verstehen: Begriffe („Wörtern“) Gewichte bezüglich Ihrer Verwandtschaft untereinander (zu)ordnen – In riesigen Datenbanken (vor allem für Englisch) sind diese Verwandtschaftsbeziehungen abgelegt. • ABER: Abkürzungen, Kunstworte (AnkunftsZeitA, AnkunftsZeitB) Suffixe/Präfixe (hatName), fehlerhafte Wörter, frei erfundene Wörter lassen keine automatisierte Verarbeitung zu. – Eingriff des Menschen ist notwendig Forschungskongress Lange Nacht der Forschung 2009 © 2009 Johann Höchtl, Donau Universität Krems
  • 15. Beispiel: Das Auto und seine Verwandten Quelle: www.Opencyc.org Forschungskongress Lange Nacht der Forschung 2009 © 2009 Johann Höchtl, Donau Universität Krems
  • 16. Anwendungen computerunterstützen semantischen Verstehens im E-Government Forschungskongress Lange Nacht der Forschung 2009 © 2009 Johann Höchtl, Donau Universität Krems
  • 17. Unsere Station: N – A18 Forschungskongress Lange Nacht der Forschung 2009 © 2009 Johann Höchtl, Donau Universität Krems
  • 18. Danke für die Aufmerksamkeit! Unser Stand: N - A18 1. Stock Forschungskongress Lange Nacht der Forschung 2009 © 2009 Johann Höchtl, Donau Universität Krems
  • 19. Links • Gerti Kappel, Horst Kargl, Gerhard Kramler, Andrea Schauerhuber, Martina Seidl, Michael Strommer, and Manuel Wimmer, “Matching Metamodels with Semantic Systems - An Experience Report,” Mainz, 2007, pp. 38-52. • Fabien Duchateau and Zohra Bellahsène, “Designing a Benchmark for the Assessment of XML Schema Matching Tools,” Vienna, Austria: ACM, 2007. • Hong-Hai Do and Erhard Rahm, “Matching large schemas: Approaches and evaluation,” Science Direct, 2007, pp. 857-885. • www.opencyc.org • http://www.w3.org/2001/sw/ Forschungskongress Lange Nacht der Forschung 2009 © 2009 Johann Höchtl, Donau Universität Krems