Bedeutungsorientierte Suche
mit Sprachverstehen
statt Stichwortsuche
Eine Kurzpräsentation in zwölf Folien, 2013-11-29
Problem der Kunden und Lösung von SEMPRIA
1. Problem
Archivbesitzer (Verlage, Rundfunkhäuser, Web-Sites, Organisationen . ...
SEMPRIA Entstehung

1992 bis heute:

Forschung der AG Intelligente Informations- und Kommunikationssysteme von Prof. Helbi...
SEMPRIA Forschung und Unternehmen

3/ 12

SEMPRIA GmbH mit Sitz in Düsseldorf

Kooperation mit der AG Intelligente Informa...
SEMPRIA Kompetenz: Bedeutungsanalyse
Bedeutungsanalyse von Texten:
Natürliche Sprache
Bedeutungsdarstellung durch semantis...
SEMPRIA Kompetenz: Wissensbasen

5/ 12

Aufbau lexikalisch-semantischer Ressourcen
– Synonyme, Unter-/Oberbegriffe, Nomina...
SEMPRIA Kompetenz: Computerlexika
Kennzahlen
35.000 semantisch umfassende Einträge (alle linguistischen
Beschreibungsebene...
SEMPRIA-Search Beispiel
Nutzeranfrage:
Import von Öl
Zusätzliche richtige Treffer gegenüber Stichwortsuche (

Vollständigk...
SEMPRIA-Search Einsatzbereiche
Suchfunktion (im Web oder in-house) für Textarchive von:
– Zeitungen, Zeitschriften
– Radio...
SEMPRIA-Search Merkmale 1
Traditionelle Suchmaschinen beherrschen nur:
Flexion, Derivation, Komposita (teils unvollständig...
SEMPRIA-Search Merkmale 2
Bezüge von Pronomen * Die X1 kritisierte den Y. Sie1 antwortete . . .
Beziehungen zwischen Objek...
Produkt: SEMPRIA-Search ASP
Gehostete Suchlösung:
flexibel
keine Hardwarekosten, kein Installations-Aufwand, kein Update-Au...
Produkt: SEMPRIA-Search Server
Eine individuelle Installation beim Archiv-Anbieter.
Randbedingungen:

12/ 12

Vereinbarung...
Impressum

SEMPRIA GmbH
Grafenberger Allee 277–287
40237 Düsseldorf

Telefon: 0211/566693-57
Fax: 0211/566693-58
Web: http...
Nächste SlideShare
Wird geladen in …5
×

Bedeutungsorientierte Suche mit Sprachverstehen statt Stichwortsuche

290 Aufrufe

Veröffentlicht am

SEMPRIA-Search ist eine Suchmaschine neuen Typs, die erstmals eine
bedeutungsorientierte Suche für das Deutsche anbietet. Im Gegensatz zu
traditionellen Suchmaschinen kann SEMPRIA-Search die Mehrdeutigkeit von
Wörtern auflösen und die Beziehungen zwischen den Begriffen einer Anfrage
in die Suche einbeziehen. Damit wird ein entscheidender Schritt weg von der
einfachen Stichwortsuche hin zum vollen Sprachverstehen getan. Durch die
logisch-linguistische Fundierung der in SEMPRIA-Search eingesetzten
Sprachtechnologie werden Vollständigkeit und Genauigkeit der Suche erhöht.
Dabei kann SEMPRIA-Search logische Zusammenhänge zwischen Suchbegriffen und
den Begriffen in den Zieldokumenten herstellen, z.B. zwischen "importieren"
und "exportieren"/"Export"/"Exporteur", und sprachliche Beziehungen
zwischen Ausdrücken in unterschiedlichen Textteilen richtig deuten.

Veröffentlicht in: Technologie
0 Kommentare
0 Gefällt mir
Statistik
Notizen
  • Als Erste(r) kommentieren

  • Gehören Sie zu den Ersten, denen das gefällt!

Keine Downloads
Aufrufe
Aufrufe insgesamt
290
Auf SlideShare
0
Aus Einbettungen
0
Anzahl an Einbettungen
2
Aktionen
Geteilt
0
Downloads
0
Kommentare
0
Gefällt mir
0
Einbettungen 0
Keine Einbettungen

Keine Notizen für die Folie

Bedeutungsorientierte Suche mit Sprachverstehen statt Stichwortsuche

  1. 1. Bedeutungsorientierte Suche mit Sprachverstehen statt Stichwortsuche Eine Kurzpräsentation in zwölf Folien, 2013-11-29
  2. 2. Problem der Kunden und Lösung von SEMPRIA 1. Problem Archivbesitzer (Verlage, Rundfunkhäuser, Web-Sites, Organisationen . . . ): haben Probleme, ihre Archive voll und effizient zu erschließen 2. Lösung Suchmaschine SEMPRIA-Suchmaschine hilft durch höhere Vollständigkeit von Suchergebnissen höhere Genauigkeit von Suchergebnissen Fragefunktionalität (Möglichkeit gezielter Fragen) 3. Wie? eigene Technologie (60 Mannjahre) für deutsche (englische, chinesische) Texte: automatisches Sprachverstehen durch tiefe semantische Analyse 4. Alleinstellungsmerkmal der Lösung durch Einsatz von Sprachverstehen deutliche Leistungssteigerungen Nutzer (Leser, Redakteure, Analysten, . . . ) sparen Recherchezeit Nutzer finden öfter das eine relevante Dokument 1/ 12 SEMPRIA, 2013-11-29
  3. 3. SEMPRIA Entstehung 1992 bis heute: Forschung der AG Intelligente Informations- und Kommunikationssysteme von Prof. Helbig (FernUniversität in Hagen) auf dem Gebiet der wissensbasierten Systeme http://pi7.fernuni-hagen.de/forschung/ 2003 bis heute: erfolgreiche Teilnahmen an internationalen Wettbewerben im Bereich Suche und Information Retrieval (CLEF) 2009: Prof. Helbig und drei langjährige Mitarbeiter gründen die SEMPRIA GmbH 2/ 12 SEMPRIA, 2013-11-29
  4. 4. SEMPRIA Forschung und Unternehmen 3/ 12 SEMPRIA GmbH mit Sitz in Düsseldorf Kooperation mit der AG Intelligente Informations- und Kommunikationssysteme (FernUniversität in Hagen) Aktuelle Arbeitsschwerpunkte der SEMPRIA GmbH: Anpassung der bedeutungsorientierten Suchmaschine SEMPRIA-Search an individuelle Kundenbedürfnisse, Vertrieb SEMPRIA, 2013-11-29
  5. 5. SEMPRIA Kompetenz: Bedeutungsanalyse Bedeutungsanalyse von Texten: Natürliche Sprache Bedeutungsdarstellung durch semantische Netze 4/ 12 SEMPRIA, 2013-11-29
  6. 6. SEMPRIA Kompetenz: Wissensbasen 5/ 12 Aufbau lexikalisch-semantischer Ressourcen – Synonyme, Unter-/Oberbegriffe, Nominalisierungen, Schreibvarianten: semi-automatisch aus Textarchiven – 150.000 Beziehungen in Begriffs-Ontologien Aufbau logischer Regelsysteme – Erfassung komplexer Beziehungen zwischen Wortbedeutungen – Interpretation von Funktionsverbgefügen und bildhaften Ausdrücken – mehrere tausend Axiome Automatische Erzeugung von Wissensbasen aus Texten – z.B. Wikipedia (60 Millionen Sätze) Entwicklung von Werkzeugen zur Wissensakquisition – Unterstützung des Wissensingenieurs beim semi-automatischen Wissenserwerb Erfahrung im Aufbau und Nutzung großer Wissensbestände SEMPRIA, 2013-11-29
  7. 7. SEMPRIA Kompetenz: Computerlexika Kennzahlen 35.000 semantisch umfassende Einträge (alle linguistischen Beschreibungsebenen inkl. semantische Rollen und Komplemente) 50.000 unterstützende Einträge (nur Morphologie und Syntax) 800.000 Eigennamen in circa 50 Klassen 1.500.000 Komposita mit Analysen, z.B. ((Erbschafts (steuer)) reform) SEMPRIA-Search verwendet eines der größten semantischen Computerlexika 6/ 12 SEMPRIA, 2013-11-29
  8. 8. SEMPRIA-Search Beispiel Nutzeranfrage: Import von Öl Zusätzliche richtige Treffer gegenüber Stichwortsuche ( Vollständigkeit): importierten Öls Öl importen aus . . . Import von Erdgas und . . . Erdöl führte 2011 . . . Öl ein Vermiedene falsche Treffer der Stichwortsuche ( Genauigkeit durch semantische Filter): um den Import mit Öl zu bezahlen 7/ 12 SEMPRIA, 2013-11-29
  9. 9. SEMPRIA-Search Einsatzbereiche Suchfunktion (im Web oder in-house) für Textarchive von: – Zeitungen, Zeitschriften – Radio, Fernsehen – Enzyklopädien, Akten, Dokumentation . . . Alternatives Suchmodul für Content-Management-Systeme (CMS) Typo3, WordPress, . . . Unternehmensweite Suche (enterprise search) Archivierungsunterstützung – Verschlagwortung, Verstichwortung, Themenseiten – Verlinkung, ähnliche Artikel – Duplikatserkennung . . . Sentimentanalyse (opinion mining, issue management, Öffentlichkeitsarbeit) in Vorbereitung 8/ 12 SEMPRIA, 2013-11-29
  10. 10. SEMPRIA-Search Merkmale 1 Traditionelle Suchmaschinen beherrschen nur: Flexion, Derivation, Komposita (teils unvollständig) Nutzung von Metadaten facettierte Suche für einige Namensklassen SEMPRIA-Search beherrscht zusätzlich: Mehrwortausdrücke Rio de Janeiro stets als Einheit Zahlen, Maße 10 km 10000 Meter 10.000 m . . . Idiome, Metonymie * Handtuch werfen aufgeben Funktionsverbgefüge * Antrag stellen beantragen Mehrdeutigkeiten (lexikalische, strukturelle) * Lincoln: Mensch, Auto, Stadt . . . absolute Zeitangaben 31. Juli 13 31.07.2013 relative Zeitangaben vorgestern (am Mittwoch) + Metadaten 31.07.2013 facettierte Suche mittels voller Semantik * abhängig vom verfügbaren Hintergrundwissen 9/ 12 SEMPRIA, 2013-11-29
  11. 11. SEMPRIA-Search Merkmale 2 Bezüge von Pronomen * Die X1 kritisierte den Y. Sie1 antwortete . . . Beziehungen zwischen Objekten Was hat Firma X mit Kriegswaffen zu tun? Rolle von Beteiligten in Ereignissen Kauf der Dresdner Bank vs. Kauf durch Dresdner Bank Bedeutung aus mehreren Sätzen/Dokumenten Wer exportiert seltene Erden? Dokument 1: seltene Erde Neodym + Dokument 2: X führt Neodym aus semantische Suchvorschläge aus den Dokumenten Fehlerrobustheit (Rechtschreibung, Zusammenschreibung) Fussball WM Fußball-WM * abhängig vom verfügbaren Hintergrundwissen 10/ 12 SEMPRIA, 2013-11-29
  12. 12. Produkt: SEMPRIA-Search ASP Gehostete Suchlösung: flexibel keine Hardwarekosten, kein Installations-Aufwand, kein Update-Aufwand hochverfügbare Lösung in deutschem Rechenzentrum preiswerte Monatsgebühren (Einstiegsversion: SEMPRIA-Search Webstarter) automatische Software-Updates nach Vereinbarung Randbedingungen: 11/ 12 Vereinbarung der Formate für die zu durchsuchenden Archive Festlegung der Internet-Schnittstelle zur Einrichtung und Aktualisierung des Suchindexes SEMPRIA, 2013-11-29
  13. 13. Produkt: SEMPRIA-Search Server Eine individuelle Installation beim Archiv-Anbieter. Randbedingungen: 12/ 12 Vereinbarung der Formate für die zu durchsuchenden Archive (wie bei SEMPRIA-Search ASP) Betriebssystem: Linux oder verwandtes Betriebssystem Software: keine weiteren Anforderungen Plattenplatz: Größe des Archivs (als reiner Text) mal Faktor 30 bis 60 Server: 4–8 CPU-Kerne, 3 GHz (empfohlen), 4–8 GB RAM SEMPRIA, 2013-11-29
  14. 14. Impressum SEMPRIA GmbH Grafenberger Allee 277–287 40237 Düsseldorf Telefon: 0211/566693-57 Fax: 0211/566693-58 Web: http://www.sempria.de/ E-Mail: info@sempria.de Geschäftsführer: Dr. Sven Hartrumpf Handelsregister: Amtsgericht Düsseldorf, HRB 62168 UStID-Nr: DE268248179

×