SlideShare ist ein Scribd-Unternehmen logo
Wissenserschließung
     und –Modellierung:
  Ontologie vs. Volltextsuche
am Beispiel des Projektes EnArgus
            Thomas Koch
          OrbiTeam Software
           GmbH & Co. KG
   KnowledgeCamp 2012, Karlsruhe
Kurzvorstellung: EnArgus-Projekt
• Ziel: Entwicklung und Erprobung eines zentralen
  Informationssystems für Energieforschungs-
  vorhaben aus dem Bereich der Förderung durch
  Bund und Länder
• Unterschiedliche Zielgruppen
  – Die interessierte Öffentlichkeit
     • Überblick über Forschungsprojekte
  – Die Geldgeber (Ministerien, Projektträger)
     • Was wird/wurde gefördert (inhaltliche Fragen)
     • Forschungstrends, Experten, Verteilung Fördermittel etc.
Ausgangssituation
Diverse Problemstellungen und Anforderungen
• Projektdaten sind auf eine Vielzahl nicht
  kompatibler Datenbanken verstreut
• Datenbanken sind eher betriebswirtschaftlich
  motiviert und zur fachlichen Auswertung wenig
  geeignet
• Bedarf nach Auswertungswerkzeugen und
  erweiterten Recherchemöglichkeiten
• Vorhabenbeschreibungen sind oftmals sehr
  fachspezifisch – Wissen über Fachgebiet für
  Recherche erforderlich
Idee
Verbesserte Suche durch
Wissenserschließung
• Wiki-texte                              Fachexperte
    – Werden von Fachexperten
      gemeinsam verfasst
• Informationsextraktion
    – Aufbau der Ontologie
      durch Textanalyse
• Ontologie
    – Dient der formalen und expliziten
      Repräsentation von Wissen
• Suchanfrage
    – Wird durch verwandte Begriffe aus
      Ontologie angereichert
• Optimierte Suchergebnisse
     zufriedene Benutzer 


                                            Anwender
Vorgehen
• Zusammenführen von Daten aus versch. Quellen
   – Projektdaten aus PROFI (administrative Daten)
   – Projektdokumente mit Inhalt (z.B. Berichte)
   – Inhaltliche Erschließung über Suchmaschine
      • Inhaltssuche (Volltext) und Metadatensuche
• Unterstützung der Recherche durch Fachontologie
   – Fachontologie wird mit Hilfe der Energieexperten erstellt
   – Energieexperten formulieren Sachzusammenhänge im Wiki
   – Ontologieexperten realisieren Erfassung des Wikis durch
     Methoden der Sprachanalyse und Wissensextraktion
   – IT-Experten implementieren das Basis-System mit
     Suchfunktionen, die auf die Ontologie zurückgreifen
EnArgus
Systemarchitektur



Auswertung &     Suchanfragen                                       Energie-
Visualisierung   & -ergebnisse   Kooperations-    Ontologie-      forschungs
                                  Unterstützg.     Editor            -Wiki
   Recherche-Cockpit


                   BSCW Core                     Ontologie Core   Wiki-Seiten



  Index          EnArgus-DB      Dokumente        Ontologie-DB
Fakten: EnArgus®
• Nationales Forschungsvorhaben
  – Partner: aus Energieforschung und Informatik
     •   Fraunhofer FIT, FKIE, UMSICHT und ISI
     •   Forschungszentrum Jülich
     •   Ruhr-Universität Bochum
     •   OrbiTeam Software
  – Gefördert durch BMWi
     • 5. Energieforschungsprogramm
       der Bundesregierung
     • 2 Jahre Laufzeit
         (Juli 2011 bis Juni 2013)
  – Mehr Infos:
     https://www.enargus.de
Aufwand/Nutzen
• Aufwand: Aufbau der Ontologie
  – Erfordert Expertenwissen
     • Ontologie-Experten und Experten der Fachdomäne
  – (Teil-)Automatisierung durch Sprachanalyse
     • Ziel: Fachexperten dokumentieren im Wiki und System
       extrahiert automatisch die Fachontologie daraus
• Nutzen
  – Bessere Unterstützung bei der Suche
     • z.B. Vorschlagen von verwandten Begriffen
     • Dadurch mehr relevante Treffer und zielgerichtete Suche
  – Wiki ist zugleich hilfreich für Anwender
     • Verknüpfung von Fachbegriffen mit Wiki als eine Art Glossar
EnArgus: Teilsysteme
EnArgus.master                    EnArgus.public

• Für die interne Nutzung         • Für die Öffentlichkeit
• Vollzugriff auf die Vorhaben-
  Datenbank                       • Einfache Bedienung
• Hinzufügen von Inhalten/        • Ansprechende Webseiten
  Dokumenten zu Vorhaben          • Eingeschränkter Zugriff auf
  über Kooperationsplattform
                                    Daten von Vorhaben
• Zugang zu Recherche-
  Funktionen                      • Einfache Suchfunktion
• Expertensuche, gespeicherte     • Lesender Zugriff auf
  Suchen etc.                       EnArgus.wiki
EnArgus.public
• Öffentliches
  Teilsystem
EnArgus.public
• Facetten
EnArgus.public
• Facetten
EnArgus.public
• Details
Details zum Wiki
• Vorgehensweise
   – Vorlage im Wiki für die Energie-Experten zur
     Beschreibung von Objekten
   – Aus Beschreibungen wurde von Ontologie-Experten zunächst der
     obere Teil der Ontologie aufgebaut ("upper ontology")
• Bearbeitete Fachthemen:
   –   Elektrochemische Energiespeicher
   –   CCS (Carbon Dioxide Capture and Storage)
   –   Windenergie
   –   Elektrische Energiespeicher
• Einschränkungen / Hinweise
   – Formulierungen im Wiki sollten in einfacher Sprache erfolgen, damit
     die Sprachanalyse verwertbare Ergebnisse liefert.
• Technische Basis: MoinMoin Wiki
Wiki: Beispiele
Informationsextraktion
• Aufbau der Ontologie durch Textanalyse
  – Wiki-Texte werden (durch Software) ausgewertet
  – In diesem Prozess erfolgt die Umwandlung von
    Text in Wissen!
  – Ergebnis der Informationsextraktion ist die
    (aktualisierte/erweiterte) Ontologie
  – Technik:
     • Text mining
     • Semantic Role Labeling (SRL)
  – Tools:
     • GATE (General Architecture for Text Engineering)
     • Protegé/OWL
Details zur Ontologie
• Grundlage jeder Ontologie ist eine Taxonomie
  – relevante Begriffe der Domäne werden in einem
    Baum repräsentiert
  – Begriffe sind nach Ober- und Unterklassen
    angeordnet
• Ontologie dient der Wissensrepräsentation
  – Begriffe enthalten Attribute
    (z.B. Eigenschaften oder andere Schreibweisen)
  – Zusätzliche Relationen zwischen den Begriffen
    bilden weitere semantische Beziehungen ab
Ontologiebasierte Suche

• Benutzer können eine
  Suchanfrage starten und
  Suchbegriff(e) eingeben
• in der einfachen Suche werden
  Synonyme automatisch mit in
  die Anfrage einbezogen
  (optional)
• in der erweiterten Suche
  werden semantisch verwandte
  Begriffe (aus der Ontologie)
  angeboten
Ontologiebasierte Suche

• Benutzer können eine
  Suchanfrage starten und
  Suchbegriff(e) eingeben
• in der einfachen Suche werden
  Synonyme automatisch mit in
  die Anfrage einbezogen
  (optional)
• in der erweiterten Suche
  werden semantisch verwandte
  Begriffe (aus der Ontologie)
  angeboten
Ontologiebasierte Suche

• Benutzer können eine
  Suchanfrage starten und
  Suchbegriff(e) eingeben
• in der einfachen Suche werden
  Synonyme automatisch mit in
  die Anfrage einbezogen
  (optional)
• in der erweiterten Suche
  werden semantisch verwandte
  Begriffe (aus der Ontologie)
  angeboten
Ontologiebasierte Suche

• Benutzer können eine
  Suchanfrage starten und
  Suchbegriff(e) eingeben
• in der einfachen Suche werden
  Synonyme automatisch mit in
  die Anfrage einbezogen
  (optional)
• in der erweiterten Suche
  werden semantisch verwandte
  Begriffe (aus der Ontologie)
  angeboten
Suchergebnisse
• Ansicht der Treffer
  – Darstellung von Details (pro Vorhaben)
Auswertungen
• Akkumulation der
  Suchergebnisse
  – Konkrete
    Fragestellung:
    Verteilung der
    Förderkosten
    über die Jahre
Ausblick
• Weitere Aspekte im Projekt
   – Unterstützung der Datenanalyse
      • Statistische Auswertungen von Abfragen
      • Graphische Visualisierung von Zusammenhängen
       Recherche-Cockpit (derzeit in der Entwicklung)
• Weitere Ideen für die Zukunft
   – Unterstützung von Mehrsprachigkeit
   – Ausbau der Datenbasis (Erfassung weiterer Themenfelder aus
     der Energieforschung)
   – ergonomischere Bedienung für die Fachexperten
     (z.B. durch grafischen Ontologieeditor)
   – Einbeziehung weiterer externer Datenquellen
   – Automatisierte Verschlagwortung von Vorhaben
     (durch Tagging-Verfahren)
Diskussion/Fragen
• Fragen an die KM-Community
  – Erfahrungen mit Wissensmodellierung
  – weitere Ansätze zur inhaltlichen Erschließung
    einer Anwendungsdomäne
    (und Erfahrungen damit)?
  – Erfahrungen mit ontoligiebasierter Suche
  – Unterschied ‚Fachwissen‘ vs. ‚Prozesswissen‘ ?!
     • Glossar vs. Rezeptbuch

Weitere ähnliche Inhalte

Andere mochten auch

"Digital Storytelling" auf dem betterplace labtogether
"Digital Storytelling" auf dem betterplace labtogether"Digital Storytelling" auf dem betterplace labtogether
"Digital Storytelling" auf dem betterplace labtogetherbetterplace lab
 
Paleopatología
PaleopatologíaPaleopatología
PaleopatologíaBUAP
 
Gestalten von websites mit dem cms joomla
Gestalten von websites mit dem cms joomlaGestalten von websites mit dem cms joomla
Gestalten von websites mit dem cms joomlaGuenter Nimmerfall
 
NGO-Meter das Online-Fundraising Benchmark 2014
NGO-Meter das Online-Fundraising Benchmark 2014NGO-Meter das Online-Fundraising Benchmark 2014
NGO-Meter das Online-Fundraising Benchmark 2014betterplace lab
 
Arquibioclimatica
ArquibioclimaticaArquibioclimatica
Arquibioclimaticalilirus
 
El baile y la música,
El baile y la música,El baile y la música,
El baile y la música,Musicasi
 
Economia de econ. de escala
Economia de econ. de escalaEconomia de econ. de escala
Economia de econ. de escalaLorelizabeth
 
Wie NGOs Videos einsetzen, um ihre Unterstützer emotional zu erreichen
Wie NGOs Videos einsetzen, um ihre Unterstützer emotional zu erreichenWie NGOs Videos einsetzen, um ihre Unterstützer emotional zu erreichen
Wie NGOs Videos einsetzen, um ihre Unterstützer emotional zu erreichenVolker Gaßner
 
Violencia de género
Violencia de géneroViolencia de género
Violencia de géneroMerche Ruiz
 
Ficha técnica
Ficha técnicaFicha técnica
Ficha técnicamjtorresmn
 
Lernen Mit Und Durch Medien
Lernen Mit Und Durch MedienLernen Mit Und Durch Medien
Lernen Mit Und Durch Medienbeafondu
 
Exposicindeagentestxicosyenvenenamientos
Exposicindeagentestxicosyenvenenamientos Exposicindeagentestxicosyenvenenamientos
Exposicindeagentestxicosyenvenenamientos Carolina Turrubiartez
 

Andere mochten auch (20)

Historia de Napster
Historia de NapsterHistoria de Napster
Historia de Napster
 
Metaltic
MetalticMetaltic
Metaltic
 
"Digital Storytelling" auf dem betterplace labtogether
"Digital Storytelling" auf dem betterplace labtogether"Digital Storytelling" auf dem betterplace labtogether
"Digital Storytelling" auf dem betterplace labtogether
 
Paleopatología
PaleopatologíaPaleopatología
Paleopatología
 
Bienes (1)
Bienes (1)Bienes (1)
Bienes (1)
 
Audioconferencias
AudioconferenciasAudioconferencias
Audioconferencias
 
Gestalten von websites mit dem cms joomla
Gestalten von websites mit dem cms joomlaGestalten von websites mit dem cms joomla
Gestalten von websites mit dem cms joomla
 
NGO-Meter das Online-Fundraising Benchmark 2014
NGO-Meter das Online-Fundraising Benchmark 2014NGO-Meter das Online-Fundraising Benchmark 2014
NGO-Meter das Online-Fundraising Benchmark 2014
 
Arquibioclimatica
ArquibioclimaticaArquibioclimatica
Arquibioclimatica
 
Diapositivas
DiapositivasDiapositivas
Diapositivas
 
El baile y la música,
El baile y la música,El baile y la música,
El baile y la música,
 
Economia de econ. de escala
Economia de econ. de escalaEconomia de econ. de escala
Economia de econ. de escala
 
Wie NGOs Videos einsetzen, um ihre Unterstützer emotional zu erreichen
Wie NGOs Videos einsetzen, um ihre Unterstützer emotional zu erreichenWie NGOs Videos einsetzen, um ihre Unterstützer emotional zu erreichen
Wie NGOs Videos einsetzen, um ihre Unterstützer emotional zu erreichen
 
Violencia de género
Violencia de géneroViolencia de género
Violencia de género
 
Mega mapas
Mega mapasMega mapas
Mega mapas
 
Conversaciàn con dios
Conversaciàn con diosConversaciàn con dios
Conversaciàn con dios
 
Ficha técnica
Ficha técnicaFicha técnica
Ficha técnica
 
Lernen Mit Und Durch Medien
Lernen Mit Und Durch MedienLernen Mit Und Durch Medien
Lernen Mit Und Durch Medien
 
Exposicindeagentestxicosyenvenenamientos
Exposicindeagentestxicosyenvenenamientos Exposicindeagentestxicosyenvenenamientos
Exposicindeagentestxicosyenvenenamientos
 
Lamina examen 1
Lamina examen 1Lamina examen 1
Lamina examen 1
 

Ähnlich wie Wissenserschließung und –Modellierung: Ontologie vs. Volltextsuche am Beispiel des Projektes EnArgus

Pandas und matplotlib im praktischen Einsatz
Pandas und matplotlib im praktischen EinsatzPandas und matplotlib im praktischen Einsatz
Pandas und matplotlib im praktischen EinsatzThomas Koch
 
OpenAIRE guidelines for data and literature repositories webinar_28022017
OpenAIRE guidelines for data and literature repositories webinar_28022017OpenAIRE guidelines for data and literature repositories webinar_28022017
OpenAIRE guidelines for data and literature repositories webinar_28022017Jessica Rex
 
Entwicklung eines Webportals zur Anbindung von digitalen Bibliotheken (Vorste...
Entwicklung eines Webportals zur Anbindung von digitalen Bibliotheken (Vorste...Entwicklung eines Webportals zur Anbindung von digitalen Bibliotheken (Vorste...
Entwicklung eines Webportals zur Anbindung von digitalen Bibliotheken (Vorste...Michael Riehemann
 
Einbindung von Linked Data in existierende Bibliotheksanswendungen
Einbindung von Linked Data in existierende BibliotheksanswendungenEinbindung von Linked Data in existierende Bibliotheksanswendungen
Einbindung von Linked Data in existierende Bibliotheksanswendungenredsys
 
Integration von Normdaten in Bibliotheksanwendungen auf der Basis von Semanti...
Integration von Normdaten in Bibliotheksanwendungen auf der Basis von Semanti...Integration von Normdaten in Bibliotheksanwendungen auf der Basis von Semanti...
Integration von Normdaten in Bibliotheksanwendungen auf der Basis von Semanti...redsys
 
Literaturverwaltungssysteme im Überblick (2012)
Literaturverwaltungssysteme im Überblick (2012)Literaturverwaltungssysteme im Überblick (2012)
Literaturverwaltungssysteme im Überblick (2012)Peter Mayr
 
amsl - Ergebnispräsentation der EFRE-Förderphase
amsl - Ergebnispräsentation der EFRE-Förderphaseamsl - Ergebnispräsentation der EFRE-Förderphase
amsl - Ergebnispräsentation der EFRE-FörderphaseBjörn Muschall
 
Perspektiven eines Open Web Index
Perspektiven eines Open Web IndexPerspektiven eines Open Web Index
Perspektiven eines Open Web IndexDirk Lewandowski
 
Fit für die digitale Bibliothek? (2007)
Fit für die digitale Bibliothek? (2007)Fit für die digitale Bibliothek? (2007)
Fit für die digitale Bibliothek? (2007)Ralf Stockmann
 
Mythos und Wahrheit: Wikis für die Technische Dokumentation at tekom-Regional...
Mythos und Wahrheit: Wikis für die Technische Dokumentation at tekom-Regional...Mythos und Wahrheit: Wikis für die Technische Dokumentation at tekom-Regional...
Mythos und Wahrheit: Wikis für die Technische Dokumentation at tekom-Regional...K15t
 
Wie gut sind Google und Co.?
Wie gut sind Google und Co.?Wie gut sind Google und Co.?
Wie gut sind Google und Co.?Dirk Lewandowski
 
Wie gut sind Google und Co.?
Wie gut sind Google und Co.?Wie gut sind Google und Co.?
Wie gut sind Google und Co.?Dirk Lewandowski
 
Repositorieninhalte als Linked Data bereitstellen
Repositorieninhalte als Linked Data bereitstellenRepositorieninhalte als Linked Data bereitstellen
Repositorieninhalte als Linked Data bereitstellenPascal-Nicolas Becker
 
Semesterarbeiten
SemesterarbeitenSemesterarbeiten
Semesterarbeitenscuy
 
Ausgewählte Forschungsfragen im Bereich Suche
Ausgewählte Forschungsfragen im Bereich SucheAusgewählte Forschungsfragen im Bereich Suche
Ausgewählte Forschungsfragen im Bereich SucheDirk Lewandowski
 
CCD 2012: Wissensmanagement @MPS - Sören Krasel, Daimler AG
CCD 2012: Wissensmanagement @MPS - Sören Krasel, Daimler AGCCD 2012: Wissensmanagement @MPS - Sören Krasel, Daimler AG
CCD 2012: Wissensmanagement @MPS - Sören Krasel, Daimler AGCommunardo GmbH
 
Die Zukunft der Portale - Kataloge der nächsten Generation
Die Zukunft der Portale - Kataloge der nächsten GenerationDie Zukunft der Portale - Kataloge der nächsten Generation
Die Zukunft der Portale - Kataloge der nächsten GenerationMartin Blenkle
 

Ähnlich wie Wissenserschließung und –Modellierung: Ontologie vs. Volltextsuche am Beispiel des Projektes EnArgus (20)

Fachliche Vernetzung von Repositories auf europäischer Ebene - das Beispiel N...
Fachliche Vernetzung von Repositories auf europäischer Ebene - das Beispiel N...Fachliche Vernetzung von Repositories auf europäischer Ebene - das Beispiel N...
Fachliche Vernetzung von Repositories auf europäischer Ebene - das Beispiel N...
 
Nah am Nutzer (Steinberg) - Konzept und Umsetzung eines Discovery-Services mi...
Nah am Nutzer (Steinberg) - Konzept und Umsetzung eines Discovery-Services mi...Nah am Nutzer (Steinberg) - Konzept und Umsetzung eines Discovery-Services mi...
Nah am Nutzer (Steinberg) - Konzept und Umsetzung eines Discovery-Services mi...
 
Pandas und matplotlib im praktischen Einsatz
Pandas und matplotlib im praktischen EinsatzPandas und matplotlib im praktischen Einsatz
Pandas und matplotlib im praktischen Einsatz
 
OpenAIRE guidelines for data and literature repositories webinar_28022017
OpenAIRE guidelines for data and literature repositories webinar_28022017OpenAIRE guidelines for data and literature repositories webinar_28022017
OpenAIRE guidelines for data and literature repositories webinar_28022017
 
Entwicklung eines Webportals zur Anbindung von digitalen Bibliotheken (Vorste...
Entwicklung eines Webportals zur Anbindung von digitalen Bibliotheken (Vorste...Entwicklung eines Webportals zur Anbindung von digitalen Bibliotheken (Vorste...
Entwicklung eines Webportals zur Anbindung von digitalen Bibliotheken (Vorste...
 
Einbindung von Linked Data in existierende Bibliotheksanswendungen
Einbindung von Linked Data in existierende BibliotheksanswendungenEinbindung von Linked Data in existierende Bibliotheksanswendungen
Einbindung von Linked Data in existierende Bibliotheksanswendungen
 
Integration von Normdaten in Bibliotheksanwendungen auf der Basis von Semanti...
Integration von Normdaten in Bibliotheksanwendungen auf der Basis von Semanti...Integration von Normdaten in Bibliotheksanwendungen auf der Basis von Semanti...
Integration von Normdaten in Bibliotheksanwendungen auf der Basis von Semanti...
 
Literaturverwaltungssysteme im Überblick (2012)
Literaturverwaltungssysteme im Überblick (2012)Literaturverwaltungssysteme im Überblick (2012)
Literaturverwaltungssysteme im Überblick (2012)
 
amsl - Ergebnispräsentation der EFRE-Förderphase
amsl - Ergebnispräsentation der EFRE-Förderphaseamsl - Ergebnispräsentation der EFRE-Förderphase
amsl - Ergebnispräsentation der EFRE-Förderphase
 
Perspektiven eines Open Web Index
Perspektiven eines Open Web IndexPerspektiven eines Open Web Index
Perspektiven eines Open Web Index
 
Fit für die digitale Bibliothek? (2007)
Fit für die digitale Bibliothek? (2007)Fit für die digitale Bibliothek? (2007)
Fit für die digitale Bibliothek? (2007)
 
Mythos und Wahrheit: Wikis für die Technische Dokumentation at tekom-Regional...
Mythos und Wahrheit: Wikis für die Technische Dokumentation at tekom-Regional...Mythos und Wahrheit: Wikis für die Technische Dokumentation at tekom-Regional...
Mythos und Wahrheit: Wikis für die Technische Dokumentation at tekom-Regional...
 
Wie gut sind Google und Co.?
Wie gut sind Google und Co.?Wie gut sind Google und Co.?
Wie gut sind Google und Co.?
 
Wie gut sind Google und Co.?
Wie gut sind Google und Co.?Wie gut sind Google und Co.?
Wie gut sind Google und Co.?
 
Repositorieninhalte als LinkedData bereitstellen
Repositorieninhalte als LinkedData bereitstellenRepositorieninhalte als LinkedData bereitstellen
Repositorieninhalte als LinkedData bereitstellen
 
Repositorieninhalte als Linked Data bereitstellen
Repositorieninhalte als Linked Data bereitstellenRepositorieninhalte als Linked Data bereitstellen
Repositorieninhalte als Linked Data bereitstellen
 
Semesterarbeiten
SemesterarbeitenSemesterarbeiten
Semesterarbeiten
 
Ausgewählte Forschungsfragen im Bereich Suche
Ausgewählte Forschungsfragen im Bereich SucheAusgewählte Forschungsfragen im Bereich Suche
Ausgewählte Forschungsfragen im Bereich Suche
 
CCD 2012: Wissensmanagement @MPS - Sören Krasel, Daimler AG
CCD 2012: Wissensmanagement @MPS - Sören Krasel, Daimler AGCCD 2012: Wissensmanagement @MPS - Sören Krasel, Daimler AG
CCD 2012: Wissensmanagement @MPS - Sören Krasel, Daimler AG
 
Die Zukunft der Portale - Kataloge der nächsten Generation
Die Zukunft der Portale - Kataloge der nächsten GenerationDie Zukunft der Portale - Kataloge der nächsten Generation
Die Zukunft der Portale - Kataloge der nächsten Generation
 

Mehr von Thomas Koch

Einfache Heimautomatisierung auf dem Raspberry Pi mit Python
Einfache Heimautomatisierung auf dem Raspberry Pi mit PythonEinfache Heimautomatisierung auf dem Raspberry Pi mit Python
Einfache Heimautomatisierung auf dem Raspberry Pi mit PythonThomas Koch
 
CI Signal Light in less than 100 Line of Python Code
CI Signal Light in less than 100 Line of Python CodeCI Signal Light in less than 100 Line of Python Code
CI Signal Light in less than 100 Line of Python CodeThomas Koch
 
CI-Ampel für Jenkins mit RaspberryPi und Python
CI-Ampel für Jenkins mit RaspberryPi und PythonCI-Ampel für Jenkins mit RaspberryPi und Python
CI-Ampel für Jenkins mit RaspberryPi und PythonThomas Koch
 
Facettensuche mit Lucene und Solr
Facettensuche mit Lucene und SolrFacettensuche mit Lucene und Solr
Facettensuche mit Lucene und SolrThomas Koch
 
BSCW - Teamarbeit leicht gemacht
BSCW - Teamarbeit leicht gemachtBSCW - Teamarbeit leicht gemacht
BSCW - Teamarbeit leicht gemachtThomas Koch
 
Raspberry Pi und Python
Raspberry Pi und PythonRaspberry Pi und Python
Raspberry Pi und PythonThomas Koch
 
Einführung in Raspberry Pi und GPIO
Einführung in Raspberry Pi und GPIOEinführung in Raspberry Pi und GPIO
Einführung in Raspberry Pi und GPIOThomas Koch
 
Python-IDEs - PyDev und Eclipse
Python-IDEs - PyDev und EclipsePython-IDEs - PyDev und Eclipse
Python-IDEs - PyDev und EclipseThomas Koch
 
Volltextsuche mit Lucene und Solr
Volltextsuche mit Lucene und SolrVolltextsuche mit Lucene und Solr
Volltextsuche mit Lucene und SolrThomas Koch
 
PyLucene@PyCon DE 2011
PyLucene@PyCon DE 2011PyLucene@PyCon DE 2011
PyLucene@PyCon DE 2011Thomas Koch
 
Getting Started with Dojo Toolkit
Getting Started with Dojo ToolkitGetting Started with Dojo Toolkit
Getting Started with Dojo ToolkitThomas Koch
 
Teamarbeit 2.0 (PTF 2008)
Teamarbeit 2.0 (PTF 2008) Teamarbeit 2.0 (PTF 2008)
Teamarbeit 2.0 (PTF 2008) Thomas Koch
 
Suche und PyLucene
Suche und PyLuceneSuche und PyLucene
Suche und PyLuceneThomas Koch
 

Mehr von Thomas Koch (13)

Einfache Heimautomatisierung auf dem Raspberry Pi mit Python
Einfache Heimautomatisierung auf dem Raspberry Pi mit PythonEinfache Heimautomatisierung auf dem Raspberry Pi mit Python
Einfache Heimautomatisierung auf dem Raspberry Pi mit Python
 
CI Signal Light in less than 100 Line of Python Code
CI Signal Light in less than 100 Line of Python CodeCI Signal Light in less than 100 Line of Python Code
CI Signal Light in less than 100 Line of Python Code
 
CI-Ampel für Jenkins mit RaspberryPi und Python
CI-Ampel für Jenkins mit RaspberryPi und PythonCI-Ampel für Jenkins mit RaspberryPi und Python
CI-Ampel für Jenkins mit RaspberryPi und Python
 
Facettensuche mit Lucene und Solr
Facettensuche mit Lucene und SolrFacettensuche mit Lucene und Solr
Facettensuche mit Lucene und Solr
 
BSCW - Teamarbeit leicht gemacht
BSCW - Teamarbeit leicht gemachtBSCW - Teamarbeit leicht gemacht
BSCW - Teamarbeit leicht gemacht
 
Raspberry Pi und Python
Raspberry Pi und PythonRaspberry Pi und Python
Raspberry Pi und Python
 
Einführung in Raspberry Pi und GPIO
Einführung in Raspberry Pi und GPIOEinführung in Raspberry Pi und GPIO
Einführung in Raspberry Pi und GPIO
 
Python-IDEs - PyDev und Eclipse
Python-IDEs - PyDev und EclipsePython-IDEs - PyDev und Eclipse
Python-IDEs - PyDev und Eclipse
 
Volltextsuche mit Lucene und Solr
Volltextsuche mit Lucene und SolrVolltextsuche mit Lucene und Solr
Volltextsuche mit Lucene und Solr
 
PyLucene@PyCon DE 2011
PyLucene@PyCon DE 2011PyLucene@PyCon DE 2011
PyLucene@PyCon DE 2011
 
Getting Started with Dojo Toolkit
Getting Started with Dojo ToolkitGetting Started with Dojo Toolkit
Getting Started with Dojo Toolkit
 
Teamarbeit 2.0 (PTF 2008)
Teamarbeit 2.0 (PTF 2008) Teamarbeit 2.0 (PTF 2008)
Teamarbeit 2.0 (PTF 2008)
 
Suche und PyLucene
Suche und PyLuceneSuche und PyLucene
Suche und PyLucene
 

Wissenserschließung und –Modellierung: Ontologie vs. Volltextsuche am Beispiel des Projektes EnArgus

  • 1. Wissenserschließung und –Modellierung: Ontologie vs. Volltextsuche am Beispiel des Projektes EnArgus Thomas Koch OrbiTeam Software GmbH & Co. KG KnowledgeCamp 2012, Karlsruhe
  • 2. Kurzvorstellung: EnArgus-Projekt • Ziel: Entwicklung und Erprobung eines zentralen Informationssystems für Energieforschungs- vorhaben aus dem Bereich der Förderung durch Bund und Länder • Unterschiedliche Zielgruppen – Die interessierte Öffentlichkeit • Überblick über Forschungsprojekte – Die Geldgeber (Ministerien, Projektträger) • Was wird/wurde gefördert (inhaltliche Fragen) • Forschungstrends, Experten, Verteilung Fördermittel etc.
  • 3. Ausgangssituation Diverse Problemstellungen und Anforderungen • Projektdaten sind auf eine Vielzahl nicht kompatibler Datenbanken verstreut • Datenbanken sind eher betriebswirtschaftlich motiviert und zur fachlichen Auswertung wenig geeignet • Bedarf nach Auswertungswerkzeugen und erweiterten Recherchemöglichkeiten • Vorhabenbeschreibungen sind oftmals sehr fachspezifisch – Wissen über Fachgebiet für Recherche erforderlich
  • 4. Idee Verbesserte Suche durch Wissenserschließung • Wiki-texte Fachexperte – Werden von Fachexperten gemeinsam verfasst • Informationsextraktion – Aufbau der Ontologie durch Textanalyse • Ontologie – Dient der formalen und expliziten Repräsentation von Wissen • Suchanfrage – Wird durch verwandte Begriffe aus Ontologie angereichert • Optimierte Suchergebnisse  zufriedene Benutzer  Anwender
  • 5. Vorgehen • Zusammenführen von Daten aus versch. Quellen – Projektdaten aus PROFI (administrative Daten) – Projektdokumente mit Inhalt (z.B. Berichte) – Inhaltliche Erschließung über Suchmaschine • Inhaltssuche (Volltext) und Metadatensuche • Unterstützung der Recherche durch Fachontologie – Fachontologie wird mit Hilfe der Energieexperten erstellt – Energieexperten formulieren Sachzusammenhänge im Wiki – Ontologieexperten realisieren Erfassung des Wikis durch Methoden der Sprachanalyse und Wissensextraktion – IT-Experten implementieren das Basis-System mit Suchfunktionen, die auf die Ontologie zurückgreifen
  • 6. EnArgus Systemarchitektur Auswertung & Suchanfragen Energie- Visualisierung & -ergebnisse Kooperations- Ontologie- forschungs Unterstützg. Editor -Wiki Recherche-Cockpit BSCW Core Ontologie Core Wiki-Seiten Index EnArgus-DB Dokumente Ontologie-DB
  • 7. Fakten: EnArgus® • Nationales Forschungsvorhaben – Partner: aus Energieforschung und Informatik • Fraunhofer FIT, FKIE, UMSICHT und ISI • Forschungszentrum Jülich • Ruhr-Universität Bochum • OrbiTeam Software – Gefördert durch BMWi • 5. Energieforschungsprogramm der Bundesregierung • 2 Jahre Laufzeit (Juli 2011 bis Juni 2013) – Mehr Infos: https://www.enargus.de
  • 8. Aufwand/Nutzen • Aufwand: Aufbau der Ontologie – Erfordert Expertenwissen • Ontologie-Experten und Experten der Fachdomäne – (Teil-)Automatisierung durch Sprachanalyse • Ziel: Fachexperten dokumentieren im Wiki und System extrahiert automatisch die Fachontologie daraus • Nutzen – Bessere Unterstützung bei der Suche • z.B. Vorschlagen von verwandten Begriffen • Dadurch mehr relevante Treffer und zielgerichtete Suche – Wiki ist zugleich hilfreich für Anwender • Verknüpfung von Fachbegriffen mit Wiki als eine Art Glossar
  • 9. EnArgus: Teilsysteme EnArgus.master EnArgus.public • Für die interne Nutzung • Für die Öffentlichkeit • Vollzugriff auf die Vorhaben- Datenbank • Einfache Bedienung • Hinzufügen von Inhalten/ • Ansprechende Webseiten Dokumenten zu Vorhaben • Eingeschränkter Zugriff auf über Kooperationsplattform Daten von Vorhaben • Zugang zu Recherche- Funktionen • Einfache Suchfunktion • Expertensuche, gespeicherte • Lesender Zugriff auf Suchen etc. EnArgus.wiki
  • 14. Details zum Wiki • Vorgehensweise – Vorlage im Wiki für die Energie-Experten zur Beschreibung von Objekten – Aus Beschreibungen wurde von Ontologie-Experten zunächst der obere Teil der Ontologie aufgebaut ("upper ontology") • Bearbeitete Fachthemen: – Elektrochemische Energiespeicher – CCS (Carbon Dioxide Capture and Storage) – Windenergie – Elektrische Energiespeicher • Einschränkungen / Hinweise – Formulierungen im Wiki sollten in einfacher Sprache erfolgen, damit die Sprachanalyse verwertbare Ergebnisse liefert. • Technische Basis: MoinMoin Wiki
  • 16. Informationsextraktion • Aufbau der Ontologie durch Textanalyse – Wiki-Texte werden (durch Software) ausgewertet – In diesem Prozess erfolgt die Umwandlung von Text in Wissen! – Ergebnis der Informationsextraktion ist die (aktualisierte/erweiterte) Ontologie – Technik: • Text mining • Semantic Role Labeling (SRL) – Tools: • GATE (General Architecture for Text Engineering) • Protegé/OWL
  • 17. Details zur Ontologie • Grundlage jeder Ontologie ist eine Taxonomie – relevante Begriffe der Domäne werden in einem Baum repräsentiert – Begriffe sind nach Ober- und Unterklassen angeordnet • Ontologie dient der Wissensrepräsentation – Begriffe enthalten Attribute (z.B. Eigenschaften oder andere Schreibweisen) – Zusätzliche Relationen zwischen den Begriffen bilden weitere semantische Beziehungen ab
  • 18. Ontologiebasierte Suche • Benutzer können eine Suchanfrage starten und Suchbegriff(e) eingeben • in der einfachen Suche werden Synonyme automatisch mit in die Anfrage einbezogen (optional) • in der erweiterten Suche werden semantisch verwandte Begriffe (aus der Ontologie) angeboten
  • 19. Ontologiebasierte Suche • Benutzer können eine Suchanfrage starten und Suchbegriff(e) eingeben • in der einfachen Suche werden Synonyme automatisch mit in die Anfrage einbezogen (optional) • in der erweiterten Suche werden semantisch verwandte Begriffe (aus der Ontologie) angeboten
  • 20. Ontologiebasierte Suche • Benutzer können eine Suchanfrage starten und Suchbegriff(e) eingeben • in der einfachen Suche werden Synonyme automatisch mit in die Anfrage einbezogen (optional) • in der erweiterten Suche werden semantisch verwandte Begriffe (aus der Ontologie) angeboten
  • 21. Ontologiebasierte Suche • Benutzer können eine Suchanfrage starten und Suchbegriff(e) eingeben • in der einfachen Suche werden Synonyme automatisch mit in die Anfrage einbezogen (optional) • in der erweiterten Suche werden semantisch verwandte Begriffe (aus der Ontologie) angeboten
  • 22. Suchergebnisse • Ansicht der Treffer – Darstellung von Details (pro Vorhaben)
  • 23. Auswertungen • Akkumulation der Suchergebnisse – Konkrete Fragestellung: Verteilung der Förderkosten über die Jahre
  • 24. Ausblick • Weitere Aspekte im Projekt – Unterstützung der Datenanalyse • Statistische Auswertungen von Abfragen • Graphische Visualisierung von Zusammenhängen  Recherche-Cockpit (derzeit in der Entwicklung) • Weitere Ideen für die Zukunft – Unterstützung von Mehrsprachigkeit – Ausbau der Datenbasis (Erfassung weiterer Themenfelder aus der Energieforschung) – ergonomischere Bedienung für die Fachexperten (z.B. durch grafischen Ontologieeditor) – Einbeziehung weiterer externer Datenquellen – Automatisierte Verschlagwortung von Vorhaben (durch Tagging-Verfahren)
  • 25. Diskussion/Fragen • Fragen an die KM-Community – Erfahrungen mit Wissensmodellierung – weitere Ansätze zur inhaltlichen Erschließung einer Anwendungsdomäne (und Erfahrungen damit)? – Erfahrungen mit ontoligiebasierter Suche – Unterschied ‚Fachwissen‘ vs. ‚Prozesswissen‘ ?! • Glossar vs. Rezeptbuch