SlideShare ist ein Scribd-Unternehmen logo
1 von 19
Ich spreche mit dir, doch du nicht mit mir Semantische Herausforderungen elektronischen Datenaustauschs Johann Höchtl Donau Universität Krems Zentrum für E-Government
Die große Verwirrung ,[object Object]
Was ist Semantik? ,[object Object],[object Object],[object Object],[object Object],Natalie Behring-Chisholm/Getty Images für Life Magazine Semantik  – Über die Bedeutung von „Zeichen“; Nicht nur  Schrift-zeichen , sondern alles was „ begriffen “ werden kann © /cocoarmani@Flickr
Sprachprobleme “ Our wines leave you nothing to hope for” Unsere Weine lassen nichts zu wünschen übrig! Bei unseren Weinen besteht keine Hoffnung !? “ We take your Bags and send them in all directions” Wir versenden Ihr Gepäck überall hin! Wir nehmen Ihre Koffer und verschicken sie in alle Richtungen !? The Beatles:Magical Mystery Tour (1967) I say hello Hello, hello I don't know why you say goodbye I say hello
Brücken ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Istanbul Brücken Map by Openstreetmap.org Europa Asien
Super / Sub - Concepts ,[object Object],[object Object],[object Object],Experte in “eh-Alles” vs. bereichspezifisches Wissen Essen Kohlenhydrate Alkohol Natürlich konserviert Lederhosen vs. Sari Bekleidung Natürliche Materialien Bachblüten vs. Reiki Medizin Alternative Medizin Superconcept / Higher Ontology Sub-Concept / Lower Ontology Finanz    kaufen Logistik    lagern
Wer wir sind und was wir tun ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Warum ist E-Kooperation notwendig für E-Government? ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
E-Zusammenarbeit: Warum tut sich ein Staat schwer(er) dabei? ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
E-Zusammenarbeit: Voraussetzung gegenseitiges „Verstehen“ http://healthbase.netbase.com
E-Zusammenarbeit: Voraussetzung gegenseitiges „Verstehen“ ,[object Object],[object Object],[object Object],[object Object],[object Object],Reddit: Source: http://marklogic.blogspot.com/2009/09/netbase-tragicomedy-perils-of-magic-and.html
Ähnlichkeitsprobleme ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Arten von Ähnlichkeiten ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],ZielFlughafen    ZielFlghafen
Dem Computer „Verständnis“ beibringen ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Beispiel: Das Auto und seine Verwandten Quelle: www.Opencyc.org
Anwendungen computerunterstützen semantischen Verstehens im E-Government
Unsere Station:  N – A18
Danke für die Aufmerksamkeit! Unser Stand:  N - A18  1. Stock Fragen?
Links ,[object Object],[object Object],[object Object],[object Object],[object Object]

Weitere ähnliche Inhalte

Andere mochten auch (13)

tatiana te aconseja 1
tatiana te aconseja 1tatiana te aconseja 1
tatiana te aconseja 1
 
ODAaaS – Open Data Analytics as a Service
ODAaaS – Open Data Analytics as a ServiceODAaaS – Open Data Analytics as a Service
ODAaaS – Open Data Analytics as a Service
 
Sportkongress tvm change_management_okt15
Sportkongress tvm change_management_okt15Sportkongress tvm change_management_okt15
Sportkongress tvm change_management_okt15
 
Maquetacion revista
Maquetacion revistaMaquetacion revista
Maquetacion revista
 
Welche Daten wollen wir von der Verwaltung?
Welche Daten wollen wir von der Verwaltung?Welche Daten wollen wir von der Verwaltung?
Welche Daten wollen wir von der Verwaltung?
 
Conjuntos
ConjuntosConjuntos
Conjuntos
 
janik david resume 2
janik david resume 2janik david resume 2
janik david resume 2
 
Lore Pecha Kucha
Lore Pecha KuchaLore Pecha Kucha
Lore Pecha Kucha
 
Wildbachbetreuung
Wildbachbetreuung Wildbachbetreuung
Wildbachbetreuung
 
Desarrollo sustentable
Desarrollo sustentableDesarrollo sustentable
Desarrollo sustentable
 
Duale Zustellung
Duale ZustellungDuale Zustellung
Duale Zustellung
 
Historia igl 1 1
Historia igl 1 1Historia igl 1 1
Historia igl 1 1
 
Elektronische Zustellung
Elektronische ZustellungElektronische Zustellung
Elektronische Zustellung
 

Ähnlich wie Ich spreche mit dir doch du nicht mit mir - Sematische Verständigungsprobleme

Wissen nicht wissen20110503
Wissen nicht wissen20110503Wissen nicht wissen20110503
Wissen nicht wissen20110503Stefan Gradmann
 
Ontologien für Fachportale - Voraussetzungen und Nutzenpotentiale
Ontologien für Fachportale - Voraussetzungen und NutzenpotentialeOntologien für Fachportale - Voraussetzungen und Nutzenpotentiale
Ontologien für Fachportale - Voraussetzungen und NutzenpotentialeAndreas Schmidt
 
Vortrag Leipziger Gespräche final
Vortrag Leipziger Gespräche finalVortrag Leipziger Gespräche final
Vortrag Leipziger Gespräche finalAlfred Fuhr
 
Alte Sprachen, Neue Medien: Latein und Griechisch in der digitalen Gesellschaft.
Alte Sprachen, Neue Medien: Latein und Griechisch in der digitalen Gesellschaft.Alte Sprachen, Neue Medien: Latein und Griechisch in der digitalen Gesellschaft.
Alte Sprachen, Neue Medien: Latein und Griechisch in der digitalen Gesellschaft.Clemens Liedtke
 
Entitäten basierte Suche Teil 2: Alles was Du zum Knowledge Graph, Indexierun...
Entitäten basierte Suche Teil 2: Alles was Du zum Knowledge Graph, Indexierun...Entitäten basierte Suche Teil 2: Alles was Du zum Knowledge Graph, Indexierun...
Entitäten basierte Suche Teil 2: Alles was Du zum Knowledge Graph, Indexierun...Olaf Kopp
 
Der Ort der Bibliothek in der Hochschule
Der Ort der Bibliothek in der HochschuleDer Ort der Bibliothek in der Hochschule
Der Ort der Bibliothek in der HochschuleHans-Christoph Hobohm
 
Präsentation CENDOO Butler
Präsentation CENDOO ButlerPräsentation CENDOO Butler
Präsentation CENDOO ButlerCENDOO AG
 
Informatik in der Volksschule: Was - Warum - Wie?
Informatik in der Volksschule: Was - Warum - Wie?Informatik in der Volksschule: Was - Warum - Wie?
Informatik in der Volksschule: Was - Warum - Wie?Beat Döbeli Honegger
 
Semantische Herausforderungen elektronischen Datenaustauschs
Semantische Herausforderungen elektronischen DatenaustauschsSemantische Herausforderungen elektronischen Datenaustauschs
Semantische Herausforderungen elektronischen DatenaustauschsJohann Höchtl
 
PP Eva Leupolz und Ingrid Salzmann,Social media und Kompetenzerwerb
PP Eva Leupolz und Ingrid Salzmann,Social media und KompetenzerwerbPP Eva Leupolz und Ingrid Salzmann,Social media und Kompetenzerwerb
PP Eva Leupolz und Ingrid Salzmann,Social media und KompetenzerwerbIngrid Salzmann-Pfleger
 
Digitalisierte Zukünfte gestalten: Digitalisierung als kultureller Prozess.
Digitalisierte Zukünfte gestalten: Digitalisierung als kultureller Prozess.Digitalisierte Zukünfte gestalten: Digitalisierung als kultureller Prozess.
Digitalisierte Zukünfte gestalten: Digitalisierung als kultureller Prozess.Benjamin Jörissen
 
Big Data & Predictive Analytics – Eine Einführung für Verlage
Big Data & Predictive Analytics – Eine Einführung für VerlageBig Data & Predictive Analytics – Eine Einführung für Verlage
Big Data & Predictive Analytics – Eine Einführung für VerlageTim Bruysten
 
Landeskunde und Neue Medien.
Landeskunde und Neue Medien. Landeskunde und Neue Medien.
Landeskunde und Neue Medien. Ulrich Zeuner
 
Über die paradoxalen Strukturen des Digitalen und ihre Bedeutung für die Frag...
Über die paradoxalen Strukturen des Digitalen und ihre Bedeutung für die Frag...Über die paradoxalen Strukturen des Digitalen und ihre Bedeutung für die Frag...
Über die paradoxalen Strukturen des Digitalen und ihre Bedeutung für die Frag...Dan Verständig
 
Wunschmaschinen − Menschen und Museen im Web 2.0
Wunschmaschinen − Menschen und Museen im Web 2.0Wunschmaschinen − Menschen und Museen im Web 2.0
Wunschmaschinen − Menschen und Museen im Web 2.0Helge_David
 

Ähnlich wie Ich spreche mit dir doch du nicht mit mir - Sematische Verständigungsprobleme (20)

Wissen nicht wissen20110503
Wissen nicht wissen20110503Wissen nicht wissen20110503
Wissen nicht wissen20110503
 
Ontologien für Fachportale - Voraussetzungen und Nutzenpotentiale
Ontologien für Fachportale - Voraussetzungen und NutzenpotentialeOntologien für Fachportale - Voraussetzungen und Nutzenpotentiale
Ontologien für Fachportale - Voraussetzungen und Nutzenpotentiale
 
Die Gespenster der Digitalen Bildung
Die Gespenster der Digitalen BildungDie Gespenster der Digitalen Bildung
Die Gespenster der Digitalen Bildung
 
Fachinformation, neue Version?
Fachinformation, neue Version?Fachinformation, neue Version?
Fachinformation, neue Version?
 
Vortrag Leipziger Gespräche final
Vortrag Leipziger Gespräche finalVortrag Leipziger Gespräche final
Vortrag Leipziger Gespräche final
 
Alte Sprachen, Neue Medien: Latein und Griechisch in der digitalen Gesellschaft.
Alte Sprachen, Neue Medien: Latein und Griechisch in der digitalen Gesellschaft.Alte Sprachen, Neue Medien: Latein und Griechisch in der digitalen Gesellschaft.
Alte Sprachen, Neue Medien: Latein und Griechisch in der digitalen Gesellschaft.
 
Entitäten basierte Suche Teil 2: Alles was Du zum Knowledge Graph, Indexierun...
Entitäten basierte Suche Teil 2: Alles was Du zum Knowledge Graph, Indexierun...Entitäten basierte Suche Teil 2: Alles was Du zum Knowledge Graph, Indexierun...
Entitäten basierte Suche Teil 2: Alles was Du zum Knowledge Graph, Indexierun...
 
Der Ort der Bibliothek in der Hochschule
Der Ort der Bibliothek in der HochschuleDer Ort der Bibliothek in der Hochschule
Der Ort der Bibliothek in der Hochschule
 
Präsentation CENDOO Butler
Präsentation CENDOO ButlerPräsentation CENDOO Butler
Präsentation CENDOO Butler
 
WiSe 2013 | IT-Zertifikat: AMM - Semantic Web I: Mikroformate
WiSe 2013 | IT-Zertifikat: AMM - Semantic Web I: MikroformateWiSe 2013 | IT-Zertifikat: AMM - Semantic Web I: Mikroformate
WiSe 2013 | IT-Zertifikat: AMM - Semantic Web I: Mikroformate
 
Informatik in der Volksschule: Was - Warum - Wie?
Informatik in der Volksschule: Was - Warum - Wie?Informatik in der Volksschule: Was - Warum - Wie?
Informatik in der Volksschule: Was - Warum - Wie?
 
Semantische Herausforderungen elektronischen Datenaustauschs
Semantische Herausforderungen elektronischen DatenaustauschsSemantische Herausforderungen elektronischen Datenaustauschs
Semantische Herausforderungen elektronischen Datenaustauschs
 
Kompetenzentwicklung im Social Web
Kompetenzentwicklung im Social WebKompetenzentwicklung im Social Web
Kompetenzentwicklung im Social Web
 
PP Eva Leupolz und Ingrid Salzmann,Social media und Kompetenzerwerb
PP Eva Leupolz und Ingrid Salzmann,Social media und KompetenzerwerbPP Eva Leupolz und Ingrid Salzmann,Social media und Kompetenzerwerb
PP Eva Leupolz und Ingrid Salzmann,Social media und Kompetenzerwerb
 
Trends für Schulen
Trends für Schulen Trends für Schulen
Trends für Schulen
 
Digitalisierte Zukünfte gestalten: Digitalisierung als kultureller Prozess.
Digitalisierte Zukünfte gestalten: Digitalisierung als kultureller Prozess.Digitalisierte Zukünfte gestalten: Digitalisierung als kultureller Prozess.
Digitalisierte Zukünfte gestalten: Digitalisierung als kultureller Prozess.
 
Big Data & Predictive Analytics – Eine Einführung für Verlage
Big Data & Predictive Analytics – Eine Einführung für VerlageBig Data & Predictive Analytics – Eine Einführung für Verlage
Big Data & Predictive Analytics – Eine Einführung für Verlage
 
Landeskunde und Neue Medien.
Landeskunde und Neue Medien. Landeskunde und Neue Medien.
Landeskunde und Neue Medien.
 
Über die paradoxalen Strukturen des Digitalen und ihre Bedeutung für die Frag...
Über die paradoxalen Strukturen des Digitalen und ihre Bedeutung für die Frag...Über die paradoxalen Strukturen des Digitalen und ihre Bedeutung für die Frag...
Über die paradoxalen Strukturen des Digitalen und ihre Bedeutung für die Frag...
 
Wunschmaschinen − Menschen und Museen im Web 2.0
Wunschmaschinen − Menschen und Museen im Web 2.0Wunschmaschinen − Menschen und Museen im Web 2.0
Wunschmaschinen − Menschen und Museen im Web 2.0
 

Mehr von Danube University Krems, Centre for E-Governance

Mehr von Danube University Krems, Centre for E-Governance (20)

Smart Cities workshop at CeDEM17
Smart Cities workshop at CeDEM17Smart Cities workshop at CeDEM17
Smart Cities workshop at CeDEM17
 
#CeDEM17 - Towards an Open Data based ICT Reference Architecture for Smart Ci...
#CeDEM17 - Towards an Open Data based ICT Reference Architecture for Smart Ci...#CeDEM17 - Towards an Open Data based ICT Reference Architecture for Smart Ci...
#CeDEM17 - Towards an Open Data based ICT Reference Architecture for Smart Ci...
 
#CeDEM17 - Financial Payments and Smart Cities
#CeDEM17 - Financial Payments and Smart Cities #CeDEM17 - Financial Payments and Smart Cities
#CeDEM17 - Financial Payments and Smart Cities
 
#CeDEM2017 Smart Cities of Self-Determined Data Subjects
#CeDEM2017 Smart Cities of Self-Determined Data Subjects#CeDEM2017 Smart Cities of Self-Determined Data Subjects
#CeDEM2017 Smart Cities of Self-Determined Data Subjects
 
Open Data as Enabler of Public Service Co-creation: Exploring the Drivers and...
Open Data as Enabler of Public Service Co-creation:Exploring the Drivers and...Open Data as Enabler of Public Service Co-creation:Exploring the Drivers and...
Open Data as Enabler of Public Service Co-creation: Exploring the Drivers and...
 
DatalEt-Ecosystem Provider - The DEEP project
DatalEt-Ecosystem Provider - The DEEP projectDatalEt-Ecosystem Provider - The DEEP project
DatalEt-Ecosystem Provider - The DEEP project
 
Towards Open Justice: ICT acceptance in the Greek justice system
Towards Open Justice: ICT acceptance in the Greek justice systemTowards Open Justice: ICT acceptance in the Greek justice system
Towards Open Justice: ICT acceptance in the Greek justice system
 
[X]CHANGING PERSPECTIVES
[X]CHANGING PERSPECTIVES[X]CHANGING PERSPECTIVES
[X]CHANGING PERSPECTIVES
 
Using fuzzy cognitive maps as decision support tool for smart cities goraczek
Using fuzzy cognitive maps as decision support tool for smart cities  goraczekUsing fuzzy cognitive maps as decision support tool for smart cities  goraczek
Using fuzzy cognitive maps as decision support tool for smart cities goraczek
 
Understanding of smartphone divide dal yong
Understanding of smartphone divide  dal yongUnderstanding of smartphone divide  dal yong
Understanding of smartphone divide dal yong
 
The motivations behind open access publishing judith schossboeck
The motivations behind open access publishing  judith schossboeckThe motivations behind open access publishing  judith schossboeck
The motivations behind open access publishing judith schossboeck
 
Social media as hobed of racism and hate speech kobayashi, kaigo, kwak
Social media as hobed of racism and hate speech kobayashi, kaigo, kwakSocial media as hobed of racism and hate speech kobayashi, kaigo, kwak
Social media as hobed of racism and hate speech kobayashi, kaigo, kwak
 
Social media and citizen engagement in asia skoric
Social media and citizen engagement in asia  skoricSocial media and citizen engagement in asia  skoric
Social media and citizen engagement in asia skoric
 
Realizin modeling and evaluation city's enerfy efficiency leonidas anthopoulos
Realizin modeling and evaluation city's enerfy efficiency leonidas anthopoulosRealizin modeling and evaluation city's enerfy efficiency leonidas anthopoulos
Realizin modeling and evaluation city's enerfy efficiency leonidas anthopoulos
 
Post 2015 paris c limate conference politics on the internet manuela hartwig
Post 2015 paris c limate conference politics on the internet  manuela hartwigPost 2015 paris c limate conference politics on the internet  manuela hartwig
Post 2015 paris c limate conference politics on the internet manuela hartwig
 
Open government and national sovereignty ivo babaja
Open government and national sovereignty  ivo babajaOpen government and national sovereignty  ivo babaja
Open government and national sovereignty ivo babaja
 
Health r isk communication in the digital era myojung chung
Health r isk communication in the digital era myojung chungHealth r isk communication in the digital era myojung chung
Health r isk communication in the digital era myojung chung
 
An analysis of japanese local government facebook profiles muneo kaigo
An analysis of japanese local government facebook profiles muneo kaigoAn analysis of japanese local government facebook profiles muneo kaigo
An analysis of japanese local government facebook profiles muneo kaigo
 
GovCamp 2016 - Co-Creation
GovCamp 2016 - Co-CreationGovCamp 2016 - Co-Creation
GovCamp 2016 - Co-Creation
 
Datenschutzbeauftragte werden in Zukunft eine wichtige Rolle im Unternehmen s...
Datenschutzbeauftragte werden in Zukunft eine wichtige Rolle im Unternehmen s...Datenschutzbeauftragte werden in Zukunft eine wichtige Rolle im Unternehmen s...
Datenschutzbeauftragte werden in Zukunft eine wichtige Rolle im Unternehmen s...
 

Ich spreche mit dir doch du nicht mit mir - Sematische Verständigungsprobleme

  • 1. Ich spreche mit dir, doch du nicht mit mir Semantische Herausforderungen elektronischen Datenaustauschs Johann Höchtl Donau Universität Krems Zentrum für E-Government
  • 2.
  • 3.
  • 4. Sprachprobleme “ Our wines leave you nothing to hope for” Unsere Weine lassen nichts zu wünschen übrig! Bei unseren Weinen besteht keine Hoffnung !? “ We take your Bags and send them in all directions” Wir versenden Ihr Gepäck überall hin! Wir nehmen Ihre Koffer und verschicken sie in alle Richtungen !? The Beatles:Magical Mystery Tour (1967) I say hello Hello, hello I don't know why you say goodbye I say hello
  • 5.
  • 6.
  • 7.
  • 8.
  • 9.
  • 10. E-Zusammenarbeit: Voraussetzung gegenseitiges „Verstehen“ http://healthbase.netbase.com
  • 11.
  • 12.
  • 13.
  • 14.
  • 15. Beispiel: Das Auto und seine Verwandten Quelle: www.Opencyc.org
  • 17. Unsere Station: N – A18
  • 18. Danke für die Aufmerksamkeit! Unser Stand: N - A18 1. Stock Fragen?
  • 19.

Hinweis der Redaktion

  1. My name is Johann Höchtl I am from Danube University Austria and I will present you some challenges of semantic interoperability and recent research to overcome the problems. Semantic interoperability is much about connecting concepts, thus the term semantic “bridging”. Istanbul would not be metropoly of the importance it has without the two big bridges connecting Europa and Asia. When thinking about Europe and Asia, certain associations arouse. Both have a characteristic food culture, traditional clothing and distinct medical cultures. Terms as Corn and Rice, Red Wine and Sake, Bachblüten and Reiki have something in common, a relationship which can be modeled on a higher level.
  2. While the first three concepts fall into the food domain with Corn and Rice being an important protein source, Lederhose and Sari have in common that they are super of concept Clothing and share the property Natural Material and Bachblüten and Reiki are alternative medical treatments. To even more complicate things you can identify horizontal properties. They have in common that they all can be bought which belongs to Finance domain. What we can identify here are relationships and properties, hierarchy attributes. In terms of knowledge engineering these properties are termed superconcepts and sub-concepts or Higher Ontology vs. Lower ontology. As a knowledge worker you may find ask yourself whether you are a generalist or specialist.
  3. After this small introductory stuff about what semantic bridging is about, some more information about my workplace. I work for Danube University Krems, the only publicly owned university for continuing education in Austria. The research focus of Center for E-Government is in E-Democracy and the impact of electronic participation on society. You will find out more about what we do when you browse to and participate on our public blog. If you are interested you may submit a paper to to E-Journal of E-Democracy and Open Government.
  4. So why are we as a center for e-Government interested in Semantic Ontology driven data exchange? Because the current state of affairs in semantic land does not permit unguided exchange on the semantic level. As long as only technical interoperability is concerned for example when you can strictly follow an XML schema specification, things are fine. But not when it comes down to semantic systems without enriched domain knowledge. In the research we made together with the CIO section of Austrian Chancellery we found out that the recall rate of semantic bridging systems which focus on domain knowledge is higher than in systems which try to extract or reconstruct that domain knowledge by dictionary lookups, word frequency analysis or stemmer approaches. Three months ago netbase made a new service publicly available, a Content Intelligence platform for healthcare. Based on user input he gets treatment advises and possible causes and cures for diseases. While some of the results may be funny, but taken to seriously those advice can be more of harm than good. Here some funny assertions by the system. Since it’s release the system has improved as those funny assertions are not returned any longer.
  5. So why are we as a center for e-Government interested in Semantic Ontology driven data exchange? Because the current state of affairs in semantic land does not permit unguided exchange on the semantic level. As long as only technical interoperability is concerned for example when you can strictly follow an XML schema specification, things are fine. But not when it comes down to semantic systems without enriched domain knowledge. In the research we made together with the CIO section of Austrian Chancellery we found out that the recall rate of semantic bridging systems which focus on domain knowledge is higher than in systems which try to extract or reconstruct that domain knowledge by dictionary lookups, word frequency analysis or stemmer approaches. Three months ago netbase made a new service publicly available, a Content Intelligence platform for healthcare. Based on user input he gets treatment advises and possible causes and cures for diseases. While some of the results may be funny, but taken to seriously those advice can be more of harm than good. Here some funny assertions by the system. Since it’s release the system has improved as those funny assertions are not returned any longer.
  6. Some fundamentals properties on semantics. First and foremost semantic bridging is much about the detection of similarity in a computerized manner. When semantic information is for example in OWL-DL format it first has to be converted into machine processable representation, which usably is that of a matrix. The two dimensions of the matrix contain the similarity of identified concepts and their similarity expressed between 0 and 1 with 0 meaning no similarity and 1 meaning either identical or full semantic match. As for the human eye a matrix is not the most intuitive form to visualize semantic information, for the human perception, Directed Acyclic Graphs or for special inheritance relationships trees are sensible graphical representations. The naïve approach to compute similarity is to completely enumerate all concepts and to compare pairwise. The theoretical amount of required data processing power for a complete DNA analysis or Internet Data Mining required new comparison algorithms, which reduce the computational complexity to less than NP-complete. A prominent early algorithm was the marching ants algorithm to solve the traveling salesman problem in reasonable time.
  7. Many of those semantic similarity problems have their origins in detecting structural similarity, for example comparing the similarity between graphs. Especially in the realm of graph similarity, the influence of semantic similarit research resulted in new approaches and algorithms. While the number of edit operations to transform a tree A into a structural equivalent tree B are rather old, similarity flooding is a quite new methodology. The idea behind similarity flooding is the fundamental assumption, that two concepts are similar, if their neighbors are similar. While this algorithm iteratively traverses the graph at least two-fold and has terrible runtime complexity, additional sensible constraints help to improve the performance for example the maximum depth at which to propagate a similarity of node based on its surrounding nodes or branch prediction to stop comparing branches which are unlikely to match given a certain threshold. Besides the structural similarity of Graphs the element names and their assigned data types also contain semantic information. Dictionary bases algorithms calculate the relatedness of words or similar words may be identified by the soundex or levenshtein-algorithm. Combining multiple similarity measures into one concept, eg. Structural similarity between two nodes and their soundex similarity is another challenge. Once the similarity matrix has been established, the most likely matching pairs have to be determined. Based on similarity indices in the matrix Concepts of A can been as feature vectores and compared to the feature vectors of concept B with the euclidean distance, the well-know cosine distance or the Jaccard coefficent. The Jaccard coefficient measures similarity between sample sets, and is defined as the size of the intersection divided by the size of the union of the sample sets.
  8. While the previous slide presented algorithms derived from schema matching which are applicable in ontology matching, these algorithms do not account enough for the semantics in an ontology. A frequent problem is to identify the most specific ancestor in an ontology. The EDGE and LEACOCK algorithm for example measure the relatedness of ontologies entirely on distance between edges in the ontology represented as a Directed Graph. In 1995 RESNIK proposed a similarity approach which accounts for the depth of the concepts in the Graph. A node carries less information the higher it can be found along the inheritance line. Dekang Lin refined this concept in 1998 with a very clever, universally applicable, domain and resource-neutral concept. He defines similarity by the amount of information the concepts share in relation to the smallest common sub-concept. To give you an idea on how complex this is, in 2005 a paper was presented to WWW Conference in Chiba Japan. The Department of CS of University of Indiana, US, compared a traditional tree-based approach to a graph-based analysis of similarity between all concepts available on DMOZ.org, excluding world and regional. In 2005 DMoz.org had 150.000 pages. The Calculation of graph-based similarity on hierarchical component and the two non-hierarchical components symbolic and related cross-links required a total of 5000 CPU-hours on a massively parallel CPU cluster consisting of 416 Prestonian cores. But abbreviations or association words add a level of complexity which prevents automatic inference of concepts . In this cases either a custom dictionary knowledge represented in SWRL predicate logic or simply a human based mapping can solve these mapping problems.