Integrationsansätze: Überblick und Potentiale semantischer Technologien Abteilungsleiter im  Forschungsbereich Information Process Engineering FZI Forschungszentrum Informatik, Karlsruhe [email_address] http://www.fzi.de/ipe Andreas Schmidt
Agenda Strukturierung der Integrationsproblematik Informationsebene Anwendungsebene Prozessebene Präsentationsebene Potentiale semantischer Technologien Informationsebene Anwendungsebene Prozessebene Präsentationsebene Fazit
Integrationsebenen Technische Ebene Informationsebene Anwendungslogikebene Prozeßebene Präsentationsebene Informationsquellen Datenmodell, Schema, semantische Heterogenität Präsentationsfragmente client-seitige Integration Netzwerkprotokolle, RPC Darstellungssyntax Dienste Dienstschnittstelle, -semantik Dienstfindung, -orchestrierung
Informationsperspektive Einzubindende „Quellen“ sind  Informationsquellen Interaktion mit den externen Quellen läuft über das Anfrage-Ergebnis-Paradigma Es existiert eine zentrale Stelle, an der alle Informationen zusammenlaufen Hauptproblem:  Überwindung der semantischen Heterogenität  (Datenmodell, Schema, Instanzdaten) Architekturen zur konsistenten Datenhaltung (Aktualisierung!)
Arten von Integrationskonflikten Datenmodell Logische Ebene: Schema Daten Instanzen Unterschiedliche Ausdrucksmächtigkeit von Datenmodellen Relational, Objektorientiert, XML, Semistrukturiert Freiheitsgrade in der Modellierung der realen Welt klassische »Schemaintegration« Zusammenführen von Instanzen (Objektidentität/Duplikaterkennung) Widersprüchlichkeit, Inkonsistenzen, Subjektivität
Arten von Integrationskonflikten Datenmodell Schema Daten Instanzen Unterschiedliche Ausdrucksmächtigkeit von Datenmodellen Relational, Objektorientiert, XML, Semistrukturiert Freiheitsgrade in der Modellierung der realen Welt klassische »Schemaintegration« Zusammenführen von Instanzen (Objektidentität/Duplikaterkennung) Widersprüchlichkeit, Inkonsistenzen, Subjektivität
Arten von Integrationskonflikten Datenmodell Schema Daten Instanzen Unterschiedliche Ausdrucksmächtigkeit von Datenmodellen Relational, Objektorientiert, XML, Semistrukturiert Freiheitsgrade in der Modellierung der realen Welt klassische »Schemaintegration« Zusammenführen von Instanzen (Objektidentität/Duplikaterkennung) Widersprüchlichkeit, Inkonsistenzen, Subjektivität
Arten von Integrationskonflikten Datenmodell Schema Daten Instanzen Unterschiedliche Ausdrucksmächtigkeit von Datenmodellen Relational, Objektorientiert, XML, Semistrukturiert Freiheitsgrade in der Modellierung der realen Welt klassische »Schemaintegration« Zusammenführen von Instanzen (Objektidentität/Duplikaterkennung) Widersprüchlichkeit, Inkonsistenzen, Subjektivität
Ebenen der semantischen Integration Schemaintegration   (bzw. Integration auf Schemaebene) Zusammenführen und semantische Vereinheitlichung allein auf der Basis von Schemainformationen Typen, Klassen, Attribute, Vererbungsrelation etc. Abbildung wird auf alle Instanzen angewendet Mapping-Tools Instanzintegration   (bzw. Integration auf Instanzebene) Zusammenführen von Informationen über einzelne Instanzen (oder Objekte) auf der Basis von Werten typisch: Ähnlichkeitsmaße, paarweise Vergleich, Objektidentität, wertabhängige Abbildungsregeln Schemainformation reicht als Information nicht aus!
Konflikte auf Instanzebene Probleme Duplikate  Veraltete Daten falsche Daten System 1 System 2 Neuestr. 8, Heidelberg, 69115, Deutschland
Aufbau einer zentralen Datenbasis, in die die Inhalte der angeschlossenen Quellen in einem Vorverarbeitungsschritt importiert werden. Diese Datenbasis stellt die integrierte Sicht dar   materialisierter Ansatz a priori Integration (eager) Nutzung der Systeme der Quellen für die Anfrageauswertung (Durchreichen von Anfragen). Die integrierte Sicht ist physisch nicht vorhanden; sie wird von Mediatoren dynamisch bereitgestellt: virtueller Ansatz Integration bei Bedarf (lazy) Architektur : Virtuell vs. materialisiert
Materialisierter Ansatz Zentrale Datenbasis (periodischer) Import in die zentrale Datenbasis Quellen Anwendung für Anfragen wird nur die  zentrale Datenbasis genutzt
Virtuelle Integration Wrapper Wrapper Wrapper Mediator Facilitator Mediator Quellenauswahl Schema- und Instanzintegration Datenmodell- integration
Materialisierter Ansatz – Vorteile Einfach zu realisieren Anwendungsentwicklung unterscheidet sich durch zentrale Datenbasis kaum vom Ein-Quellen-Fall Mehr Informationen über vorhandene Daten Performant  Direkte Datenbankzugriffe für Anfrageauswertung Entkopplung von (evtl. langsamen, nur teilweise verfügbaren) externen Systemen gezielte Optimierungen möglich Nachbearbeitungsoperationen möglich Von den Fremdanbietern gelieferte Daten können (auch aufwendig) geprüft und bereinigt werden Aggregation von Daten ebenfalls leicht möglich
Materialisierter Ansatz: Nachteile (redundante) Speicherung evtl. großer Datenmengen leistungsfähige Infrastruktur erforderlich Aktualität der Daten ist nicht gewährleistet klassisches Caching-Problem Aktualisierung  auf Initiative der Datenquellen organisatorische Maßnahmen erforderlich Insbesondere: wir brauchen ein Austauschformat! Aktualisierung auf Initiative des Portals bei großen Datenmengen häufig unpraktikabel keine Information, was geändert wurde Keine Kontrolle des Urhebers mehr über die Daten!
Integrationsebenen  Technische Ebene Informationsebene Anwendungslogikebene Prozeßebene Präsentationsebene Informationsquellen Datenmodell, Schema, semantische Heterogenität Präsentationsfragmente client-seitige Integration Netzwerkprotokolle, RPC Darstellungssyntax Dienste Dienstschnittstelle, -semantik Dienstfindung, -orchestrierung
Dienstperspektive Einzubindende Systeme sind  Dienste klar definierte Schnittstelle und zu erbringende Funktionalität deutlich spezifischer als Anfrageschnittstellen Autonomen Dienste soll durch eine Infrastruktur die gegenseitige Nutzung ermöglicht werden => Dienstorientierte Architekturen  Hauptprobleme Wie mache ich Dienste interoperabel? Wie finde ich benötigte Dienste? Wie beschreibe ich Dienste?
Kernprobleme für dienstorientierte Architekturen Kommunikationsprotokoll (technische Ebene) Kodierung von Methodenaufruf und Parameterübergabe Authentifizierung, Sicherheit etc. Dienstbeschreibung Konkrete Adresse (wie erreiche ich den Dienst) Dienstschnittstelle (wie rufe ich ihn auf) Semantik des Dienstes (was tut der Dienst) Organisatorisches (was kostet der Dienst o.ä.) Verzeichnisdienste Möglichkeiten zur Aggregierung von Diensten
Dienstorientierte Architekturen – Lose Kopplung Dienst- nehmer (service requestor) nutzen Dienst- nehmer (service requestor) nutzen Dienst- nehmer (service requestor) nutzen Implementie-rungen werden austauschbar Mehrere Dienste hinter derselben Fassade mehrschrittige Verarbeitung
Prozessperspektive Auf der Abstraktionsebene von Diensten spielt nicht nur die isolierte Dienstfunktionalität eine Rolle, sondern auch deren Abfolge. hier ist auch die wichtige Brücke zwischen der IT-Sicht und der Geschäfts-Sicht Dementsprechend spielt auch die Prozessintegration eine große Rolle. viele Versuche, Prozess- und Dienstebene voneinander zu trennen allerdings: klare und eindeutige Trennung ist nicht so einfach möglich
Die Web-Service-Welt Nachrichten Metadaten Ressourcen Transaktionen Zuverlässigkeit Sicherheit Geschäftsprozesse Management WSDL WS-Discovery UDDI WS-Policy WS-Metadata-Exchange SOAP WS-Notification WS-Adressing Web Services Resources Framework WS-Business Activity WS-Atomic Transact. WS-Coordination WS-Reliability WS-Reliable Messag. WS-Security WS-Trust WS-Security Policy WS-Federation WS-Secure Conversat. BPEL WS-Choreography WS-Choreography Description Language BPML WSMF WS-Management MUWS WS-Events MOWS WSMF-WSM
Integrationsebenen Technische Ebene Informationsebene Anwendungslogikebene Prozeßebene Präsentationsebene Informationsquellen Datenmodell, Schema, semantische Heterogenität Präsentationsfragmente client-seitige Integration Netzwerkprotokolle, RPC Darstellungssyntax Dienste Dienstschnittstelle, -semantik Dienstfindung, -orchestrierung
Präsentationsebene Grundidee ist hier: einheitliche Darstellung von unterschiedlichen Inhalten Ansätze Einbindung gerenderter Inhalte, also HTML-Fragmente  (=> Portlets) reine Overlay-Techniken Einbindung von GUI-Steuerelementen
Google Maps Mashups
Potentiale semantischer Technologien
Motivation Hauptherausforderung bei der Informationsintegration ist die Überwindung der semantischen Heterogenität Dabei steht die prinzipielle Machbarkeit außer Frage. Aber wie bekommt semantische Integration auch effizient (i.S.d. menschlichen Aufwandes), wartbar und skalierbar in den Griff? kann nur durch einen höheren Grad der Automatisierung erreicht werden und durch Spezifikationen auf höherer Abstraktionsebene
Semantische Technologien... ... sind ein Sammelbegriff für aktuelle technische Ansätze, um dies zu realisieren. Überwiegend bedienen sie sich Ontologien als Instrument zur expliziten und maschinenverarbeitbaren Repräsentation von Semantik. Prominenteste Vision dieser Technologieansätze ist das Semantic Web.
Arten von Semantik [Uschold (2002), “Where are the Semantics in the Semantic Web?”]
Ontologien in der Informatik Eine  Ontologie  [in der Informatik] ist eine explizite Spezifikation  einer  Konzeptualisierung   [explicit specification of a conceptualization]  (Gruber 1993) ein  gemeinsames  Verständnis einer  bestimmten  Domäne  [shared understanding of a domain of interest]   (Uschold & Grüninger 1996) Formalitätsgrad kann variieren: von kontrollierten Vokabularen bis hin zu schwergewichtigen Ontologien mit logischer Axiomatisierung
Integrationsebenen Technische Ebene Informationsebene Anwendungslogikebene Prozeßebene Präsentationsebene gemeinsame Semantik Abbildungen auf konzeptueller Ebene spezifizieren Präsentationsfragmente Microformats Dienste Dienstsemantik Dienstfindung, -orchestrierung
Grundidee Modellierung von Konzepten und Relationen der Anwendungswelt als Ontologie  (= konzeptuelle Modellierung) Deklarative Spezifikation von Abbildungsregeln zwischen der Ontologie und den beteiligten Quellen Zur Laufzeit: Ausführung dieser Abbildungsregeln Fortgeschritten: semiautomatische Entdeckung diese Abbildungsregeln
Anwendungen: Datenaustausch RDBMS 1 RDBMS 2 XML XML Ontologie XSL-T Export-Werkzeuge des RDBMS Import-Werkzeuge des RDBMS Bezug XML-Struktur    Ontologie Bezug XML-Struktur    Ontologie XSL-T Werkzeug automatisierter Vorgang manueller Vorgang
Bewertung Ontologien sind wohl dosiert eingesetzt elegante (da auf deskriptiven Spezifikationen aufbauend) Bausteine für typische Integrationsprobleme, vor allem wenn viel Domänenwissen benötigt wird mit unvollständigen Informationen umgegangen wird Schritt auf dem Weg zu mehr modellgetriebenen Integrationsansätzen
Integrationsebenen Technische Ebene Informationsebene Anwendungslogikebene Prozeßebene Präsentationsebene gemeinsame Semantik Abbildungen auf konzeptueller Ebene spezifizieren Präsentationsfragmente Microformats Dienste Dienstsemantik Dienstfindung, -orchestrierung
Motivation Bislang hat sich die Beschreibung von Web Services auf syntaktische Aspekte beschränkt Überprüfung, ob syntaktisch korrekter Aufruf Generierung von sprachspezifischen Bindings Aber: keine Suche nach Diensten, die etwas Bestimmtes tun keine automatisierte Kopplung keine Prüfung von Qualitätsbeschreibungen Idee: Erweiterung der Beschreibungskonzepte für Web Services durch ontologiebasierte Verfahren, so dass eine maschinenverarbeitbare semantische Beschreibung entsteht.
Dienste: Was wollen wir semantisch beschreiben? Semantik der übertragenen Parameter  Mittel: semantische Annotation der Nachrichtenschemata Zweck: Interoperabilität/Mediation Semantik der Dienstfunktionalität Mittel: Annotation, ggf. mit Vor-/Nachbedingungen Zweck: Dienstfindung und -komposition Semantik der Dienstgüte  Mittel: formale Beschreibung der Dienstgüte / SLAs Zweck: Dienstfindung und Überprüfbarkeit Ausführungssemantik  Mittel: formale Modellierung der Abläufe Zweck: Validierung, Verifikation
Beispiel: SemanticUDDI Grundidee: UDDI-Dienstverzeichnisse sind derzeit für Fachexperten nur schwer zu benutzen deshalb: Annotation um Fachsemantik dies kann allerdings nur durch die Fachexperten selbst erfolgen Lösung Kopplung eines UDDI-Verzeichnisses an ein SemanticWiki-System Projekt im Auftrag der LUBW – Landesanstalt für Umweltschutz Baden-Württemberg
Ontologiezentrierter Architekturstil
Ontologie für die Lernunterstützung http://professional-learning.eu
Integrationsebenen Technische Ebene Informationsebene Anwendungslogikebene Prozeßebene Präsentationsebene gemeinsame Semantik Abbildungen auf konzeptueller Ebene spezifizieren Präsentationsfragmente Microformats Prozesse Traceability, Compliance
Semantik für die Geschäftsprozessmodellierung Traceability Explizite semantische Zusammenhänge zwischen Prozessmodellen und technischen Diensten dadurch leichteres Change Management erste Anwendungen im eGovernment Überprüfung der Compliance Beschreibung von Ausführungsbedingungen damit z.B. Risikomanagement automatisierbar
Integrationsebenen Technische Ebene Informationsebene Anwendungslogikebene Prozeßebene Präsentationsebene gemeinsame Semantik Abbildungen auf konzeptueller Ebene spezifizieren Präsentationsfragmente Microformats Prozesse Traceability, Compliance
Fazit: Semantische Technologien Ontologiegestützte semantische Technologien sind mächtige Werkzeuge standardisierte Technologien (Sprachen, Werkzeuge) für die breite Anwendung vorhanden erste Implementierungserfahrungen bieten Vorteile in Richtung modellgetriebener Entwicklung bessere Beherrschbarkeit komplexer Systeme durch höhere Abstraktionsebene Allerdings sollte ihr Einsatz wohldosiert erfolgen Berücksichtigung von Skalierbarkeit Aufwendige Entwicklung von Ontologien Nutzen von Ontologien liegt vor allem im Umgang mit unvollständigen Informationen hohem Maß an Hintergrundwissen
Kontakt Andreas Schmidt Ableitungsleiter  Forschungsbereich Information Process Engineering FZI Forschungszentrum Informatik, Karlsruhe [email_address] http://www.fzi.de/ipe

Integrationsansätze: Überblick und Potentiale semantischer Technologien

  • 1.
    Integrationsansätze: Überblick undPotentiale semantischer Technologien Abteilungsleiter im Forschungsbereich Information Process Engineering FZI Forschungszentrum Informatik, Karlsruhe [email_address] http://www.fzi.de/ipe Andreas Schmidt
  • 2.
    Agenda Strukturierung derIntegrationsproblematik Informationsebene Anwendungsebene Prozessebene Präsentationsebene Potentiale semantischer Technologien Informationsebene Anwendungsebene Prozessebene Präsentationsebene Fazit
  • 3.
    Integrationsebenen Technische EbeneInformationsebene Anwendungslogikebene Prozeßebene Präsentationsebene Informationsquellen Datenmodell, Schema, semantische Heterogenität Präsentationsfragmente client-seitige Integration Netzwerkprotokolle, RPC Darstellungssyntax Dienste Dienstschnittstelle, -semantik Dienstfindung, -orchestrierung
  • 4.
    Informationsperspektive Einzubindende „Quellen“sind Informationsquellen Interaktion mit den externen Quellen läuft über das Anfrage-Ergebnis-Paradigma Es existiert eine zentrale Stelle, an der alle Informationen zusammenlaufen Hauptproblem: Überwindung der semantischen Heterogenität (Datenmodell, Schema, Instanzdaten) Architekturen zur konsistenten Datenhaltung (Aktualisierung!)
  • 5.
    Arten von IntegrationskonfliktenDatenmodell Logische Ebene: Schema Daten Instanzen Unterschiedliche Ausdrucksmächtigkeit von Datenmodellen Relational, Objektorientiert, XML, Semistrukturiert Freiheitsgrade in der Modellierung der realen Welt klassische »Schemaintegration« Zusammenführen von Instanzen (Objektidentität/Duplikaterkennung) Widersprüchlichkeit, Inkonsistenzen, Subjektivität
  • 6.
    Arten von IntegrationskonfliktenDatenmodell Schema Daten Instanzen Unterschiedliche Ausdrucksmächtigkeit von Datenmodellen Relational, Objektorientiert, XML, Semistrukturiert Freiheitsgrade in der Modellierung der realen Welt klassische »Schemaintegration« Zusammenführen von Instanzen (Objektidentität/Duplikaterkennung) Widersprüchlichkeit, Inkonsistenzen, Subjektivität
  • 7.
    Arten von IntegrationskonfliktenDatenmodell Schema Daten Instanzen Unterschiedliche Ausdrucksmächtigkeit von Datenmodellen Relational, Objektorientiert, XML, Semistrukturiert Freiheitsgrade in der Modellierung der realen Welt klassische »Schemaintegration« Zusammenführen von Instanzen (Objektidentität/Duplikaterkennung) Widersprüchlichkeit, Inkonsistenzen, Subjektivität
  • 8.
    Arten von IntegrationskonfliktenDatenmodell Schema Daten Instanzen Unterschiedliche Ausdrucksmächtigkeit von Datenmodellen Relational, Objektorientiert, XML, Semistrukturiert Freiheitsgrade in der Modellierung der realen Welt klassische »Schemaintegration« Zusammenführen von Instanzen (Objektidentität/Duplikaterkennung) Widersprüchlichkeit, Inkonsistenzen, Subjektivität
  • 9.
    Ebenen der semantischenIntegration Schemaintegration (bzw. Integration auf Schemaebene) Zusammenführen und semantische Vereinheitlichung allein auf der Basis von Schemainformationen Typen, Klassen, Attribute, Vererbungsrelation etc. Abbildung wird auf alle Instanzen angewendet Mapping-Tools Instanzintegration (bzw. Integration auf Instanzebene) Zusammenführen von Informationen über einzelne Instanzen (oder Objekte) auf der Basis von Werten typisch: Ähnlichkeitsmaße, paarweise Vergleich, Objektidentität, wertabhängige Abbildungsregeln Schemainformation reicht als Information nicht aus!
  • 10.
    Konflikte auf InstanzebeneProbleme Duplikate Veraltete Daten falsche Daten System 1 System 2 Neuestr. 8, Heidelberg, 69115, Deutschland
  • 11.
    Aufbau einer zentralenDatenbasis, in die die Inhalte der angeschlossenen Quellen in einem Vorverarbeitungsschritt importiert werden. Diese Datenbasis stellt die integrierte Sicht dar materialisierter Ansatz a priori Integration (eager) Nutzung der Systeme der Quellen für die Anfrageauswertung (Durchreichen von Anfragen). Die integrierte Sicht ist physisch nicht vorhanden; sie wird von Mediatoren dynamisch bereitgestellt: virtueller Ansatz Integration bei Bedarf (lazy) Architektur : Virtuell vs. materialisiert
  • 12.
    Materialisierter Ansatz ZentraleDatenbasis (periodischer) Import in die zentrale Datenbasis Quellen Anwendung für Anfragen wird nur die zentrale Datenbasis genutzt
  • 13.
    Virtuelle Integration WrapperWrapper Wrapper Mediator Facilitator Mediator Quellenauswahl Schema- und Instanzintegration Datenmodell- integration
  • 14.
    Materialisierter Ansatz –Vorteile Einfach zu realisieren Anwendungsentwicklung unterscheidet sich durch zentrale Datenbasis kaum vom Ein-Quellen-Fall Mehr Informationen über vorhandene Daten Performant Direkte Datenbankzugriffe für Anfrageauswertung Entkopplung von (evtl. langsamen, nur teilweise verfügbaren) externen Systemen gezielte Optimierungen möglich Nachbearbeitungsoperationen möglich Von den Fremdanbietern gelieferte Daten können (auch aufwendig) geprüft und bereinigt werden Aggregation von Daten ebenfalls leicht möglich
  • 15.
    Materialisierter Ansatz: Nachteile(redundante) Speicherung evtl. großer Datenmengen leistungsfähige Infrastruktur erforderlich Aktualität der Daten ist nicht gewährleistet klassisches Caching-Problem Aktualisierung auf Initiative der Datenquellen organisatorische Maßnahmen erforderlich Insbesondere: wir brauchen ein Austauschformat! Aktualisierung auf Initiative des Portals bei großen Datenmengen häufig unpraktikabel keine Information, was geändert wurde Keine Kontrolle des Urhebers mehr über die Daten!
  • 16.
    Integrationsebenen TechnischeEbene Informationsebene Anwendungslogikebene Prozeßebene Präsentationsebene Informationsquellen Datenmodell, Schema, semantische Heterogenität Präsentationsfragmente client-seitige Integration Netzwerkprotokolle, RPC Darstellungssyntax Dienste Dienstschnittstelle, -semantik Dienstfindung, -orchestrierung
  • 17.
    Dienstperspektive Einzubindende Systemesind Dienste klar definierte Schnittstelle und zu erbringende Funktionalität deutlich spezifischer als Anfrageschnittstellen Autonomen Dienste soll durch eine Infrastruktur die gegenseitige Nutzung ermöglicht werden => Dienstorientierte Architekturen Hauptprobleme Wie mache ich Dienste interoperabel? Wie finde ich benötigte Dienste? Wie beschreibe ich Dienste?
  • 18.
    Kernprobleme für dienstorientierteArchitekturen Kommunikationsprotokoll (technische Ebene) Kodierung von Methodenaufruf und Parameterübergabe Authentifizierung, Sicherheit etc. Dienstbeschreibung Konkrete Adresse (wie erreiche ich den Dienst) Dienstschnittstelle (wie rufe ich ihn auf) Semantik des Dienstes (was tut der Dienst) Organisatorisches (was kostet der Dienst o.ä.) Verzeichnisdienste Möglichkeiten zur Aggregierung von Diensten
  • 19.
    Dienstorientierte Architekturen –Lose Kopplung Dienst- nehmer (service requestor) nutzen Dienst- nehmer (service requestor) nutzen Dienst- nehmer (service requestor) nutzen Implementie-rungen werden austauschbar Mehrere Dienste hinter derselben Fassade mehrschrittige Verarbeitung
  • 20.
    Prozessperspektive Auf derAbstraktionsebene von Diensten spielt nicht nur die isolierte Dienstfunktionalität eine Rolle, sondern auch deren Abfolge. hier ist auch die wichtige Brücke zwischen der IT-Sicht und der Geschäfts-Sicht Dementsprechend spielt auch die Prozessintegration eine große Rolle. viele Versuche, Prozess- und Dienstebene voneinander zu trennen allerdings: klare und eindeutige Trennung ist nicht so einfach möglich
  • 21.
    Die Web-Service-Welt NachrichtenMetadaten Ressourcen Transaktionen Zuverlässigkeit Sicherheit Geschäftsprozesse Management WSDL WS-Discovery UDDI WS-Policy WS-Metadata-Exchange SOAP WS-Notification WS-Adressing Web Services Resources Framework WS-Business Activity WS-Atomic Transact. WS-Coordination WS-Reliability WS-Reliable Messag. WS-Security WS-Trust WS-Security Policy WS-Federation WS-Secure Conversat. BPEL WS-Choreography WS-Choreography Description Language BPML WSMF WS-Management MUWS WS-Events MOWS WSMF-WSM
  • 22.
    Integrationsebenen Technische EbeneInformationsebene Anwendungslogikebene Prozeßebene Präsentationsebene Informationsquellen Datenmodell, Schema, semantische Heterogenität Präsentationsfragmente client-seitige Integration Netzwerkprotokolle, RPC Darstellungssyntax Dienste Dienstschnittstelle, -semantik Dienstfindung, -orchestrierung
  • 23.
    Präsentationsebene Grundidee isthier: einheitliche Darstellung von unterschiedlichen Inhalten Ansätze Einbindung gerenderter Inhalte, also HTML-Fragmente (=> Portlets) reine Overlay-Techniken Einbindung von GUI-Steuerelementen
  • 24.
  • 25.
  • 26.
    Motivation Hauptherausforderung beider Informationsintegration ist die Überwindung der semantischen Heterogenität Dabei steht die prinzipielle Machbarkeit außer Frage. Aber wie bekommt semantische Integration auch effizient (i.S.d. menschlichen Aufwandes), wartbar und skalierbar in den Griff? kann nur durch einen höheren Grad der Automatisierung erreicht werden und durch Spezifikationen auf höherer Abstraktionsebene
  • 27.
    Semantische Technologien... ...sind ein Sammelbegriff für aktuelle technische Ansätze, um dies zu realisieren. Überwiegend bedienen sie sich Ontologien als Instrument zur expliziten und maschinenverarbeitbaren Repräsentation von Semantik. Prominenteste Vision dieser Technologieansätze ist das Semantic Web.
  • 28.
    Arten von Semantik[Uschold (2002), “Where are the Semantics in the Semantic Web?”]
  • 29.
    Ontologien in derInformatik Eine Ontologie [in der Informatik] ist eine explizite Spezifikation einer Konzeptualisierung [explicit specification of a conceptualization] (Gruber 1993) ein gemeinsames Verständnis einer bestimmten Domäne [shared understanding of a domain of interest] (Uschold & Grüninger 1996) Formalitätsgrad kann variieren: von kontrollierten Vokabularen bis hin zu schwergewichtigen Ontologien mit logischer Axiomatisierung
  • 30.
    Integrationsebenen Technische EbeneInformationsebene Anwendungslogikebene Prozeßebene Präsentationsebene gemeinsame Semantik Abbildungen auf konzeptueller Ebene spezifizieren Präsentationsfragmente Microformats Dienste Dienstsemantik Dienstfindung, -orchestrierung
  • 31.
    Grundidee Modellierung vonKonzepten und Relationen der Anwendungswelt als Ontologie (= konzeptuelle Modellierung) Deklarative Spezifikation von Abbildungsregeln zwischen der Ontologie und den beteiligten Quellen Zur Laufzeit: Ausführung dieser Abbildungsregeln Fortgeschritten: semiautomatische Entdeckung diese Abbildungsregeln
  • 32.
    Anwendungen: Datenaustausch RDBMS1 RDBMS 2 XML XML Ontologie XSL-T Export-Werkzeuge des RDBMS Import-Werkzeuge des RDBMS Bezug XML-Struktur  Ontologie Bezug XML-Struktur  Ontologie XSL-T Werkzeug automatisierter Vorgang manueller Vorgang
  • 33.
    Bewertung Ontologien sindwohl dosiert eingesetzt elegante (da auf deskriptiven Spezifikationen aufbauend) Bausteine für typische Integrationsprobleme, vor allem wenn viel Domänenwissen benötigt wird mit unvollständigen Informationen umgegangen wird Schritt auf dem Weg zu mehr modellgetriebenen Integrationsansätzen
  • 34.
    Integrationsebenen Technische EbeneInformationsebene Anwendungslogikebene Prozeßebene Präsentationsebene gemeinsame Semantik Abbildungen auf konzeptueller Ebene spezifizieren Präsentationsfragmente Microformats Dienste Dienstsemantik Dienstfindung, -orchestrierung
  • 35.
    Motivation Bislang hatsich die Beschreibung von Web Services auf syntaktische Aspekte beschränkt Überprüfung, ob syntaktisch korrekter Aufruf Generierung von sprachspezifischen Bindings Aber: keine Suche nach Diensten, die etwas Bestimmtes tun keine automatisierte Kopplung keine Prüfung von Qualitätsbeschreibungen Idee: Erweiterung der Beschreibungskonzepte für Web Services durch ontologiebasierte Verfahren, so dass eine maschinenverarbeitbare semantische Beschreibung entsteht.
  • 36.
    Dienste: Was wollenwir semantisch beschreiben? Semantik der übertragenen Parameter Mittel: semantische Annotation der Nachrichtenschemata Zweck: Interoperabilität/Mediation Semantik der Dienstfunktionalität Mittel: Annotation, ggf. mit Vor-/Nachbedingungen Zweck: Dienstfindung und -komposition Semantik der Dienstgüte Mittel: formale Beschreibung der Dienstgüte / SLAs Zweck: Dienstfindung und Überprüfbarkeit Ausführungssemantik Mittel: formale Modellierung der Abläufe Zweck: Validierung, Verifikation
  • 37.
    Beispiel: SemanticUDDI Grundidee:UDDI-Dienstverzeichnisse sind derzeit für Fachexperten nur schwer zu benutzen deshalb: Annotation um Fachsemantik dies kann allerdings nur durch die Fachexperten selbst erfolgen Lösung Kopplung eines UDDI-Verzeichnisses an ein SemanticWiki-System Projekt im Auftrag der LUBW – Landesanstalt für Umweltschutz Baden-Württemberg
  • 38.
  • 39.
    Ontologie für dieLernunterstützung http://professional-learning.eu
  • 40.
    Integrationsebenen Technische EbeneInformationsebene Anwendungslogikebene Prozeßebene Präsentationsebene gemeinsame Semantik Abbildungen auf konzeptueller Ebene spezifizieren Präsentationsfragmente Microformats Prozesse Traceability, Compliance
  • 41.
    Semantik für dieGeschäftsprozessmodellierung Traceability Explizite semantische Zusammenhänge zwischen Prozessmodellen und technischen Diensten dadurch leichteres Change Management erste Anwendungen im eGovernment Überprüfung der Compliance Beschreibung von Ausführungsbedingungen damit z.B. Risikomanagement automatisierbar
  • 42.
    Integrationsebenen Technische EbeneInformationsebene Anwendungslogikebene Prozeßebene Präsentationsebene gemeinsame Semantik Abbildungen auf konzeptueller Ebene spezifizieren Präsentationsfragmente Microformats Prozesse Traceability, Compliance
  • 43.
    Fazit: Semantische TechnologienOntologiegestützte semantische Technologien sind mächtige Werkzeuge standardisierte Technologien (Sprachen, Werkzeuge) für die breite Anwendung vorhanden erste Implementierungserfahrungen bieten Vorteile in Richtung modellgetriebener Entwicklung bessere Beherrschbarkeit komplexer Systeme durch höhere Abstraktionsebene Allerdings sollte ihr Einsatz wohldosiert erfolgen Berücksichtigung von Skalierbarkeit Aufwendige Entwicklung von Ontologien Nutzen von Ontologien liegt vor allem im Umgang mit unvollständigen Informationen hohem Maß an Hintergrundwissen
  • 44.
    Kontakt Andreas SchmidtAbleitungsleiter Forschungsbereich Information Process Engineering FZI Forschungszentrum Informatik, Karlsruhe [email_address] http://www.fzi.de/ipe