Lotusday Arcadeon Hagen, 19. September 2007 Session A2: 11.30 – 12.15 Uhr DPC GmbH http://www.dpc.de Dr. Christiane Görges...
Agenda <ul><li>Kurzporträt DPC GmbH </li></ul><ul><li>Unternehmenssuchmaschine – Motivation, Problemstellung und Lösungsan...
Dittrich & Partner Consulting GmbH Daten, Prozesse, Chancen Ein Kurzporträt
DPC - seit 1981 … <ul><li>Unterstützung bei der Konzeption und Realisierung komplexer und intelligenter IT-Lösungen </li><...
Sie finden uns Kieler Straße 17  42697 Solingen Herwartstraße 5  86152 Augsburg Smederijstraat 2 NL-4814 DB Breda in unser...
IBM Partnerschaft <ul><li>Advanced IBM Business Partner für die Information Management Produkte </li></ul><ul><li>Enge Zus...
Besuchen Sie uns www.dpc.de
Unternehmensweite   Suche:   Zwei interessante Aussagen… <ul><li>Die Herausforderung </li></ul><ul><ul><ul><li>“ Es ist of...
Problemstellung und Motivation Die Menge unstrukturierter Informationen verdoppelt  sich ca. alle 6 Monate. 85% aller rele...
OmniFind Schlüssel zum Erfolg Liefert die relevantesten Unternehmensdaten Strukturierte und unstrukturierte Informationen ...
<ul><li>Kein zentrales Hosting der Lösung </li></ul><ul><ul><li> Integration in IT-Infrastrukturen, verschiedene Plattfor...
<ul><li>Synonyme (Produktumbenennungen, Abkürzungen, etc.) </li></ul><ul><ul><li>Raider – Twix </li></ul></ul><ul><ul><li>...
Erfolgsfaktoren für eine unternehmensweite Suche <ul><li>Berechnung des Rankings/ Bewertung des gefundenen Dokuments </li>...
Beispiele für Suchanfragen eines Benutzers… (1) <ul><li>Defekte an Maschine XYZ (z.B. zur Qualitätssicherung) </li></ul><u...
Beispiele für Suchanfragen eines Benutzers… (2) <ul><li>Ich muss den Kunden anrufen… </li></ul><ul><ul><li>Wo ist die Emai...
Intelligente Bewertung = ideale Suchergebnisse <ul><li>Textbasierte Bewertung </li></ul><ul><ul><li>Häufigkeit der Suchbeg...
Architektur IBM OmniFind –  Intelligente Suche Intelligente und relevante Suchergebnisse  für den Benutzer Office-Dokument...
Schlüsseltechnologien der  Unternehmenssuche mit OmniFind <ul><li>Intelligenz-Bausteine </li></ul><ul><li>Synonyme </li></...
Textanalyse in OmniFind <ul><li>Spracherkennung innerhalb der Dokumente </li></ul><ul><li>IBM LanguageWare - mehrsprachige...
Metadaten/ Suchfelder für das Dateisystem <ul><li>Dateisystem </li></ul><ul><ul><li>Gewährleistung von Benutzerrechten </l...
Präsentation der Suchergebnisse Rechtschreibkorrektur Direktlinks/ Quick-Links konfigurierbar Dokument- und Datenquellen-F...
Intelligente Suche – Konzeptsuche: Einige Beispiele
Intelligente Suche:  Suchen Sie Konzepte, nicht Wörter! Wir suchen Dokumente, die mit  „ Transportschäden“ zu tun haben Un...
Intelligente Suche:  Synonyme … Suchbegriff „firma“ Dieses Dokument wäre ohne intelligente  Suche nicht gefunden worden
Intelligente Suche  nach einer Telefonnummer Eine einfache Schlagwortsuche hilft nicht immer! Hier muss der Text interpret...
Intelligente Suche:  Eingrenzen der  Ergebnisse durch Kategorien Wir suchen Dokumente, die mit  „ Transportschäden“ zu tun...
Intelligente Suche:   Korrektur von Schreibfehlern Schreibfehler „obrelandesgericht“ Automatischer Korrekturvorschlag des ...
Intelligente Suche:  Details zu jedem Dokument <ul><li>Zu jedem Dokument können Details  </li></ul><ul><li>eingeblendet we...
Authentifizierung und Zugriffskontrolle <ul><li>Authentifizierung </li></ul><ul><ul><li>Die Authentifizierung ist ein Proz...
OmniFind Administrationsrollen Enterprise Search Administrator Collection Administrator Operator Monitor <ul><li>Erstellen...
<ul><li>Domino Document Manager </li></ul><ul><li>Lotus Notes und Quickplace (Voraussetzung: Crawler greifen über DIIOP au...
Verifikation der Autorisierung  zum Abfragezeitpunkt <ul><li>Notes/Domino </li></ul><ul><li>WebSphere Portal Document Mana...
Heterogene Quellsysteme –  1 Suchpunkt Office-Dokumente Dateisystem Internet/ Intranet Datenbanken Dokumenten Management C...
Unternehmenssuche:  OmniFind und Datenquellen <ul><li>OmniFind agiert auf vielen Datenquellen wie es ein Benutzer/ origina...
OmniFind Konnektoren zu Quellsystemen <ul><li>Web content </li></ul><ul><ul><li>HTTP/HTTPS, News groups (NNTP) </li></ul><...
Konnektoren – einige Beispieldatenquellen <ul><li>Lotus Notes </li></ul><ul><ul><li>Sicherheit bis auf Dokument-Level gewä...
Portal Integration  “ auf dem Bildschirm” Projekt-Management Dokumenten-Management Diskussionsforen Content Management Web...
Integration von WebSphere Portal und OmniFind <ul><li>Anstatt der Portalsuche kann OmniFind benutzt werden, oder beide wer...
OmniFind erschließt dem Portal neue Datenquellen Sicherer Zugriff auf viele Datenquellen des Unternehmens
Suchmöglichkeiten im Portal <ul><li>Integrierte Portalsuche </li></ul><ul><li>OmniFind Suche </li></ul><ul><li>Beide paral...
Ausblick Semantische Suche und UIMA Unstructured Information Management Architecture
<ul><li>UIMA definiert eine einheitliche Schnittstelle zur Integration von Analyseschritten </li></ul><ul><ul><li>Ermöglic...
Wie kommt die Intelligenz in den Text? Ein wurde gefahren TT von Sprachteile- Annotator Entitäten- Annotator Beziehungs-  ...
Zusammenfassung <ul><li>Eine intelligente Suchmaschine, die den Inhalt des Textes „versteht“ und nicht nur nach Wörtern su...
Nächste SlideShare
Wird geladen in …5
×

A2 DPC Knowledege Wissen Griffbereit 2007 Lotusday 2007

1.997 Aufrufe

Veröffentlicht am

Knowledge - Wissen griffbereit mit IBM OmniFind Unternehmensweite Suchmaschine über alle Datenquellen hinweg - zum Beispiel Notes Datenbanken

Veröffentlicht in: Technologie, Business
0 Kommentare
0 Gefällt mir
Statistik
Notizen
  • Als Erste(r) kommentieren

  • Gehören Sie zu den Ersten, denen das gefällt!

Keine Downloads
Aufrufe
Aufrufe insgesamt
1.997
Auf SlideShare
0
Aus Einbettungen
0
Anzahl an Einbettungen
36
Aktionen
Geteilt
0
Downloads
43
Kommentare
0
Gefällt mir
0
Einbettungen 0
Keine Einbettungen

Keine Notizen für die Folie
  • A2 DPC Knowledege Wissen Griffbereit 2007 Lotusday 2007

    1. 1. Lotusday Arcadeon Hagen, 19. September 2007 Session A2: 11.30 – 12.15 Uhr DPC GmbH http://www.dpc.de Dr. Christiane Görges-Holzmüller Knowledge – Wissen griffbereit mit IBM OmniFind
    2. 2. Agenda <ul><li>Kurzporträt DPC GmbH </li></ul><ul><li>Unternehmenssuchmaschine – Motivation, Problemstellung und Lösungsansatz </li></ul><ul><li>Arbeitsweise von OmniFind </li></ul><ul><li>Intelligente Suche – Darstellung der Ergebnisse </li></ul><ul><li>Technisches </li></ul><ul><li>Datenquellen hinter OmniFind </li></ul><ul><li>OmniFind im Portal </li></ul><ul><li>Zusammenfassung </li></ul>
    3. 3. Dittrich & Partner Consulting GmbH Daten, Prozesse, Chancen Ein Kurzporträt
    4. 4. DPC - seit 1981 … <ul><li>Unterstützung bei der Konzeption und Realisierung komplexer und intelligenter IT-Lösungen </li></ul><ul><li>Kernkompetenzen: Datenanalyse, Mathematik, Statistik und Business Intelligence </li></ul><ul><li>Berater aus Mathematik, Informatik und Betriebswirtschaftslehre </li></ul>
    5. 5. Sie finden uns Kieler Straße 17 42697 Solingen Herwartstraße 5 86152 Augsburg Smederijstraat 2 NL-4814 DB Breda in unseren Niederlassungen Hosnedlgasse 16a A-1220 Wien
    6. 6. IBM Partnerschaft <ul><li>Advanced IBM Business Partner für die Information Management Produkte </li></ul><ul><li>Enge Zusammenarbeit mit den Entwicklungs-abteilungen </li></ul><ul><li>Nominierter IBM Partner für Business Intelligence Lösungen in Deutschland </li></ul><ul><li>Data Warehousing, OLAP, Reporting, Data Mining, Suchtechnologien, Informations-integration, Stammdatenverwaltung und Betrugserkennung </li></ul>
    7. 7. Besuchen Sie uns www.dpc.de
    8. 8. Unternehmensweite Suche: Zwei interessante Aussagen… <ul><li>Die Herausforderung </li></ul><ul><ul><ul><li>“ Es ist offensichtlich, dass wir alle in einem Meer von Informationen versinken. Die Herausforderung ist es, schwimmen zu lernen und nicht unterzugehen.” Studie der University of California, Berkeley School of Information Management and Systems </li></ul></ul></ul><ul><ul><ul><li>“ Ein Unternehmen mit 1.000 Mitarbeiten verliert $48.000 pro Woche – $2,5 Millionen pro Jahr – verursacht durch den Mangel Information zu finden und auszuwerten.” The High Cost of Not Finding Information, IDC Studie, siehe auch KMWorld-Volume 13, Ausgabe 3, März 2004 </li></ul></ul></ul>
    9. 9. Problemstellung und Motivation Die Menge unstrukturierter Informationen verdoppelt sich ca. alle 6 Monate. 85% aller relevanten Daten sind unstrukturiert. 30% der Arbeitszeit wird für das Suchen nach relevanten Informationen verwendet. Viele Mitarbeiter denken, dass sie vorhandene Informationen nicht ausreichend nutzen, um schnell reagieren und wichtige Entscheidungen treffen zu können. Zwei Drittel der Mitarbeiter sind der Meinung, dass Informationen nur schwer zugänglich und nicht genügend integriert sind. Trans- aktionen Dokumente Berichte e-Mails Medien Internet Inhalte Kunden Mitarbeiter Partner Schaubilder Finanzen Produkte Informationen und Fakten stammen aus einer unternehmensunabhängigen Studie (Gartner) Datenbanken
    10. 10. OmniFind Schlüssel zum Erfolg Liefert die relevantesten Unternehmensdaten Strukturierte und unstrukturierte Informationen Skaliert auf Datenmengen und Anwenderzahl Sicherheit bis auf Dokumentebene Durch Java APIs in vorhandene Anwendungen integrierbar Ergebnisse in Sekundenbruchteilen durch hochentwickelte Relevanzalgorithmen
    11. 11. <ul><li>Kein zentrales Hosting der Lösung </li></ul><ul><ul><li> Integration in IT-Infrastrukturen, verschiedene Plattformen, Wartbarkeit, … </li></ul></ul><ul><li>Kein übergreifend einheitliches Frontend </li></ul><ul><ul><li> Sollte API/Portlets zur Integration in Anwendungen haben </li></ul></ul><ul><li>Keine Verantwortung gegenüber Werbeträgern aber gegen-über Endanwendern, Fachabteilungen, den Lieferanten der Inhalte, CIO, CEO </li></ul><ul><ul><li> Interpretation von Anwenderanfragen und textanalytische Auswertung der Daten im Index </li></ul></ul><ul><li>Nicht ausschließlich Webdaten/HTML-Dokumente </li></ul><ul><ul><li> Anbindung vielfältiger Datenquellen (CMS, RDBMS, Messaging, …) </li></ul></ul><ul><li>Keine einfachen Daten: Wenig Verlinkung und weniger Redundanz </li></ul><ul><ul><li> Intelligente Algorithmen zur Erstellung der Relevanzen </li></ul></ul><ul><li>Kein Zugang für alle Anwender zu allen Informationen gewünscht </li></ul><ul><ul><li> Hohe Sicherheitsanforderungen </li></ul></ul>Enterprise Search  Websearch
    12. 12. <ul><li>Synonyme (Produktumbenennungen, Abkürzungen, etc.) </li></ul><ul><ul><li>Raider – Twix </li></ul></ul><ul><ul><li>BGH - Bundesgerichtshof </li></ul></ul><ul><li>Erkennen von Zusammenhängen </li></ul><ul><ul><li>Fahrzeug -> Auto -> Audi -> A6 </li></ul></ul><ul><ul><li>Kopfschmerzen einseitig -> Migräne </li></ul></ul><ul><ul><li>Rock (Kleidungsstück) vs. Rock (Musik) </li></ul></ul><ul><li>Expertensuche </li></ul><ul><ul><li>Wer ist Spezialist für ein bestimmtes Thema? </li></ul></ul><ul><li>Automatische Klassifizierung von Dokumenten </li></ul><ul><li>Erkennen von komplexen Wortstämmen, z.B. Ein- und Mehrzahl (Buch, Bücher, Haus, Häuser) </li></ul><ul><li>Administrierbare Links in Abhängigkeit der Suchanfrage (Quick-Links) </li></ul><ul><li>Bedeutung von Zahlen (Preis, Gewicht, Telefonnummer, …) </li></ul>Wir benötigen … eine intelligente Suche
    13. 13. Erfolgsfaktoren für eine unternehmensweite Suche <ul><li>Berechnung des Rankings/ Bewertung des gefundenen Dokuments </li></ul><ul><li>Suche muss intelligent sein und den Inhalt des Texts „verstehen“ </li></ul><ul><ul><li>Also keine einfache Stichwortsuche </li></ul></ul><ul><li>Berücksichtigung der Rechte des Benutzers </li></ul><ul><ul><li>Hätte der Benutzer das Dokument im Originalsystem sehen dürfen oder nicht? </li></ul></ul><ul><li>Suchmaschine muss Vielzahl von Datenquellen verarbeiten können </li></ul><ul><ul><li>Intranet, Internet </li></ul></ul><ul><ul><li>Datenbanksysteme (SAP, Projekt-/ Abteilungsdatenbanken, QS-Systeme, DMS, CRM, CMS usw.) </li></ul></ul><ul><ul><li>Dateisystem (Officedokumente, …) </li></ul></ul><ul><ul><li>Kollaborations-/ Email Systeme (Notes, Outlook) </li></ul></ul><ul><ul><li>Portale </li></ul></ul><ul><li>Berücksichtigung von Besonderheiten der jeweiligen Sprache </li></ul><ul><ul><li>z.B. Einzahl/ Mehrzahl/ Umlaute im Deutschen </li></ul></ul><ul><li>Skalierbarkeit </li></ul><ul><ul><li>Wenige hundert Mitarbeiter suchen meist bereits in mehreren Millionen Dokumenten </li></ul></ul><ul><ul><li>Antwortzeiten sollten im Bereich 1 Sek. liegen </li></ul></ul>
    14. 14. Beispiele für Suchanfragen eines Benutzers… (1) <ul><li>Defekte an Maschine XYZ (z.B. zur Qualitätssicherung) </li></ul><ul><ul><li>Kaputte Maschine XYZ </li></ul></ul><ul><ul><li>Gerissener Antriebsriemen an Maschine XYZ </li></ul></ul><ul><ul><li>Motorschaden an Maschine XYZ </li></ul></ul><ul><li>Experte zum Thema XYZ </li></ul><ul><ul><li>Mitarbeiter, die sich mit dem Thema XYZ gut auskennen </li></ul></ul><ul><ul><li>Projektberichte der Mitarbeiter, die Experten sind </li></ul></ul><ul><li>Vertrag </li></ul><ul><ul><li>Bausparvertrag </li></ul></ul><ul><ul><li>Kaufvertrag </li></ul></ul><ul><li>Audi Unfall </li></ul><ul><ul><li>Ist ein TT unter einen LKW gefahren </li></ul></ul><ul><ul><li>Prallte ein A4 gegen einen Baum </li></ul></ul><ul><ul><li>Stieß ein A6 mit einer S-Klasse zusammen </li></ul></ul>… und welche Ergebnisse ein Benutzer dann finden möchte:
    15. 15. Beispiele für Suchanfragen eines Benutzers… (2) <ul><li>Ich muss den Kunden anrufen… </li></ul><ul><ul><li>Wo ist die Email mit seiner Telefonnummer? </li></ul></ul><ul><ul><li>In der Email wird nicht “Telefonnummer” stehen, sondern Dinge wie “Sie können mich heute unter 07031-162021 erreichen” </li></ul></ul><ul><li>Ich muss einen Qualitätsreport erstellen… </li></ul><ul><ul><li>Wie finde ich Werkstattberichte über Bremsprobleme im Großraum Stuttgart? </li></ul></ul><ul><ul><li>Die Beschreibungen enthalten Sätze wie “Scheibe neu justiert aufgrund von Hydraulikproblemen”. Ansonsten enthalten sie nur Orts- und Straßennamen der Werkstatt </li></ul></ul><ul><li>Was sagt die Presse über unser Unternehmen… </li></ul><ul><ul><li>Schreibt die Presse positiv oder negativ über unsere Firma? </li></ul></ul><ul><ul><li>Wie äußern sich Fachmagazine über unser neues Produkt? </li></ul></ul>… und welche Ergebnisse ein Benutzer dann finden möchte:
    16. 16. Intelligente Bewertung = ideale Suchergebnisse <ul><li>Textbasierte Bewertung </li></ul><ul><ul><li>Häufigkeit der Suchbegriffe im Dokument und in der gesamten Dokumentenmenge </li></ul></ul><ul><ul><li>Räumliche Nähe der Suchbegriffe im Dokument </li></ul></ul><ul><ul><li>Kontext der Suchbegriffe: Begriff im Titel wird z.B. höher bewertet als im Text </li></ul></ul><ul><ul><li>Länge des Dokuments </li></ul></ul><ul><ul><li>Reichtum des Vokabulars </li></ul></ul><ul><li>Statische Rangfolge </li></ul><ul><ul><li>Anzahl Links im/ auf das Dokument </li></ul></ul><ul><ul><li>Datum des Dokuments (falls vorhanden) </li></ul></ul><ul><li>Intelligenzbausteine (UIMA-Annotatoren) </li></ul><ul><ul><li>Auswertung/ Gewichtung der Ergebnisse, die die Intelligenzbausteine liefern </li></ul></ul><ul><li>Konfiguration </li></ul><ul><ul><li>Für Sie wichtige Begriffe können höher gewichtet werden </li></ul></ul><ul><li>Und viele weitere… </li></ul>Auswahl der Mechanismen, wie OmniFind Dokumente bewertet: Ergebnis: Signifikante Verbesserung der Qualität der Suchergebnisse
    17. 17. Architektur IBM OmniFind – Intelligente Suche Intelligente und relevante Suchergebnisse für den Benutzer Office-Dokumente Dateisystem Internet/Intranet Datenbanken Dokumenten Management Content Management Email (Lotus Notes, Outlook) Portal CRM ERP DMS ECM <ul><li>A6 ist ein Audi </li></ul><ul><li>Audi ist ein Auto </li></ul><ul><li>Ein Auto ist ein Fahrzeug </li></ul>Folgende Bsp. könnten alle auf Qualitätsprobleme hinweisen und z.B. mit „Defekte Dichtung“ gefunden werden: Phase III: Benutzerrechte Analysephase I: Grundfunktionen <ul><li>Spracherkennung </li></ul><ul><li>Wort-/ Wortstammerkennung </li></ul><ul><li>… </li></ul><ul><li>Synonyme </li></ul><ul><li>Satzerkennung </li></ul><ul><li>Erkennung der Aus- sage des Textes </li></ul><ul><li>Mehrstufig möglich </li></ul><ul><li>Entwicklung durch Kunde, Partner </li></ul><ul><li>Open Source Framework </li></ul>Analysephase II: Intelligenzbausteine <ul><ul><li>Materialfehler </li></ul></ul><ul><ul><li>Gebrochener Dichtring </li></ul></ul><ul><ul><li>Gerissene Dichtung </li></ul></ul><ul><ul><li>Undichte Abdichtung </li></ul></ul><ul><ul><li>… </li></ul></ul>…
    18. 18. Schlüsseltechnologien der Unternehmenssuche mit OmniFind <ul><li>Intelligenz-Bausteine </li></ul><ul><li>Synonyme </li></ul><ul><li>200+ Dokumentenfilter </li></ul><ul><li>Linguistische Verarbeitung </li></ul><ul><li>Ranking </li></ul><ul><li>Indexerstellung </li></ul><ul><li>Indexanreicherung mit Analysedaten </li></ul><ul><li>Dynamisches Ranking </li></ul><ul><li>Stichwortsuche </li></ul><ul><li>Feldsuche </li></ul><ul><li>Semantische Suche </li></ul><ul><li>„ Meinten Sie?“-Suche </li></ul><ul><li>Zugriff auf Datenquellen </li></ul><ul><li>Einlesen der Quelldaten </li></ul>Suche Indizierung Sicherheit/ Rechteverwaltung Daten einlesen UIMA-Textanalyse
    19. 19. Textanalyse in OmniFind <ul><li>Spracherkennung innerhalb der Dokumente </li></ul><ul><li>IBM LanguageWare - mehrsprachige Bildung von Tokens und Grundformen (Lemma) </li></ul><ul><li>Unterstützung von mehr als 20 Sprachen und Varianten </li></ul><ul><ul><li>Chinese (Simplified and Traditional), Italian, Czech, Japanese, Danish, Korean, Dutch, Norwegian (Bokmal and Nynorsk), English, Polish, Finnish, Portuguese (National and Brazilian), French (National and Canadian), Russian, German (National and Swiss), Spanish, Greek, Swedish </li></ul></ul><ul><li>Leerzeichen und N-Gramm Tokenizer für Dokumente in anderen Sprachen (Zerlegung in Buchstaben zur Klassifikation) </li></ul>Ausdrücke mit mehreren Wörtern und Zeichen- Normalisierung: .. wouldn’t .. .. B ö blingen .. would not Boeblingen Wörterbücher Eingaben Token Beispiele Lexikalische Analyse Berechnungen Wortformenanalyse – Wurzeln, Wortstamm, Lemma .. mice .. mouse ..Häuser.. Haus
    20. 20. Metadaten/ Suchfelder für das Dateisystem <ul><li>Dateisystem </li></ul><ul><ul><li>Gewährleistung von Benutzerrechten </li></ul></ul><ul><ul><li>Konfiguration der Pfade </li></ul></ul><ul><ul><li>Einschränkung auf bestimmte Dokumenttypen möglich </li></ul></ul><ul><ul><li>OmniFind unterstützt ca. 250 Dok-Formate </li></ul></ul>Intelligente Suche möglich durch IBM OmniFind Dateiname Dateinendung Verzeichnis Dateigröße Änderungsdatum <ul><li>Dokumenttitel </li></ul><ul><ul><li>Abhängig von Anwendung </li></ul></ul>
    21. 21. Präsentation der Suchergebnisse Rechtschreibkorrektur Direktlinks/ Quick-Links konfigurierbar Dokument- und Datenquellen-Filter 3 Suchmöglichkeiten Dynamische Zusammenfassungen Metadaten Author: John Smith Title: Director of Planning email: jsmith@mycom
    22. 22. Intelligente Suche – Konzeptsuche: Einige Beispiele
    23. 23. Intelligente Suche: Suchen Sie Konzepte, nicht Wörter! Wir suchen Dokumente, die mit „ Transportschäden“ zu tun haben Und finden alle relevanten Dokumente Automatische Kategorien zeigen hier: An welchem Gericht wurde der Fall bereits verhandelt?
    24. 24. Intelligente Suche: Synonyme … Suchbegriff „firma“ Dieses Dokument wäre ohne intelligente Suche nicht gefunden worden
    25. 25. Intelligente Suche nach einer Telefonnummer Eine einfache Schlagwortsuche hilft nicht immer! Hier muss der Text interpretiert werden telefon nummer Der Begriff „telefon nummer“ kommt in diesem Dokument nicht vor. Trotzdem wird es gefunden!
    26. 26. Intelligente Suche: Eingrenzen der Ergebnisse durch Kategorien Wir suchen Dokumente, die mit „ Transportschäden“ zu tun haben Durch Klick auf eine Kategorie, lässt sich die Ergebnismenge einschränken/ verkleinern
    27. 27. Intelligente Suche: Korrektur von Schreibfehlern Schreibfehler „obrelandesgericht“ Automatischer Korrekturvorschlag des Systems
    28. 28. Intelligente Suche: Details zu jedem Dokument <ul><li>Zu jedem Dokument können Details </li></ul><ul><li>eingeblendet werden, wie z.B. </li></ul><ul><ul><li>Titel </li></ul></ul><ul><ul><li>Sprache </li></ul></ul><ul><ul><li>Quellsystem </li></ul></ul><ul><ul><li>Änderungsdatum </li></ul></ul><ul><ul><li>Kategorie </li></ul></ul><ul><ul><li>Dateigröße </li></ul></ul><ul><ul><li>Etc. </li></ul></ul>
    29. 29. Authentifizierung und Zugriffskontrolle <ul><li>Authentifizierung </li></ul><ul><ul><li>Die Authentifizierung ist ein Prozess, bei dem ein System die Identität des Anwenders verifiziert, der das System betritt </li></ul></ul><ul><ul><li>User ID und Kennwort, Smart Cards oder auch ein öffentlicher Schlüssel </li></ul></ul><ul><ul><li>OmniFind authentifiziert lediglich den ES Administrator </li></ul></ul><ul><ul><ul><li>OmniFind erwartet eine gesicherte Umgebung </li></ul></ul></ul><ul><li>Zugriffskontrolle </li></ul><ul><ul><li>Die Zugriffskontrolle ist ein Mechanismus, bei dem ein System Rechte zum Zugriff auf Daten oder zur Auslösung von Aktionen erteilt oder verweigert. </li></ul></ul><ul><ul><li>OmniFind bietet drei Stufen der Zugriffskontrolle </li></ul></ul><ul><ul><ul><li>Administrativ </li></ul></ul></ul><ul><ul><ul><li>Collection-Ebene </li></ul></ul></ul><ul><ul><ul><li>Dokument-Ebene </li></ul></ul></ul>
    30. 30. OmniFind Administrationsrollen Enterprise Search Administrator Collection Administrator Operator Monitor <ul><li>Erstellen von Collections </li></ul><ul><li>Alle Administrationsrechte </li></ul><ul><li>Vergabe dieser Rechte an andere Anwender </li></ul><ul><li>Bearbeiten, Beobachten und Kontrollieren spezieller oder sämtlicher Collections </li></ul><ul><li>System Monitoring und Kontrollfunktionen </li></ul><ul><li>Monitoring spezieller oder sämtlicher Collections </li></ul>
    31. 31. <ul><li>Domino Document Manager </li></ul><ul><li>Lotus Notes und Quickplace (Voraussetzung: Crawler greifen über DIIOP auf den Domino Server zu) </li></ul><ul><li>Portal Document Manager Repositories, die über den WebSphere II Content Edition Connector angebunden werden </li></ul><ul><li>Bei Nutzung des OF EE Search Portlets ist die SSO Sicherheit auch für Dokumente verfügbar, die über die Web Content Management bzw. Portal Crawler angebunden werden </li></ul>Single Sign-On über LTPA WebSphere Application Server Lightweight Third-Party Authentication
    32. 32. Verifikation der Autorisierung zum Abfragezeitpunkt <ul><li>Notes/Domino </li></ul><ul><li>WebSphere Portal Document Manager </li></ul><ul><li>WebSphere Portal Seiten </li></ul><ul><li>Domino Document Manager </li></ul><ul><li>Lotus QuickPlace </li></ul><ul><li>FileNet CS, P8 CM </li></ul><ul><li>Hummingbird DM </li></ul><ul><li>Windows Dateisystem </li></ul><ul><li>Windows SharePoint Services </li></ul><ul><li>Documentum </li></ul><ul><li>Open Text Livelink </li></ul><ul><li>WebSphere Portal Web Content Management V 6.0 </li></ul>
    33. 33. Heterogene Quellsysteme – 1 Suchpunkt Office-Dokumente Dateisystem Internet/ Intranet Datenbanken Dokumenten Management Content Management Email (Lotus Notes, Outlook) Portal CRM ERP DMS ECM Forschung/ Entwicklung Marketing/ Vertrieb Kunden/ Partner Recht/ Personal Qualitäts- sicherung … Zentrale Suche: IBM OmniFind Nativer Konnektor zum Quellsystem <ul><li>Verbindungsaufbau </li></ul><ul><li>Erkennen/ verarbeiten der Datenstruktur des Quellsystems </li></ul><ul><li>Sicherheit/ Benutzerrechte </li></ul><ul><li>… </li></ul>…
    34. 34. Unternehmenssuche: OmniFind und Datenquellen <ul><li>OmniFind agiert auf vielen Datenquellen wie es ein Benutzer/ originaler Client direkt in diesem System auch tun würde </li></ul><ul><li>Berücksichtigung von Benutzerrechten </li></ul><ul><ul><li>Statisch: Benutzerrechte werden bei der Indexerstellung gespeichert </li></ul></ul><ul><ul><li>Dynamisch: Vor der Anzeige der Suchergebnisse werden die Rechte beim Quellsystem „angefragt“ </li></ul></ul><ul><ul><li>Beide Verfahren auch kombinierbar </li></ul></ul><ul><li>Keine Anpassungen in den Quellsystemen nötig </li></ul><ul><li>ODBC/JDBC Schnittstelle zur Anbindung von Datenbanksystemen </li></ul><ul><li>API/ Data Listener verfügbar, um beliebige weitere Datenquellen einbinden zu können </li></ul>
    35. 35. OmniFind Konnektoren zu Quellsystemen <ul><li>Web content </li></ul><ul><ul><li>HTTP/HTTPS, News groups (NNTP) </li></ul></ul><ul><ul><li>WebSphere Portal portlets, Portal Document Manager </li></ul></ul><ul><li>Collaboration </li></ul><ul><ul><li>Lotus Notes Datenbanken, Domino.Doc, QuickPlace </li></ul></ul><ul><ul><li>MS Exchange public folders </li></ul></ul><ul><li>Dateisysteme (Windows, Unix, Novell) </li></ul><ul><li>Enterprise Content Management Systeme </li></ul><ul><ul><li>DB2 Content Manager </li></ul></ul><ul><ul><li>Über WebSphere Information Integrator Content Edition: FileNet Content Services, FileNet P8, Documentum, Hummingbird DM, OpenText LiveLink </li></ul></ul><ul><li>Relationale Datenquellen </li></ul><ul><ul><li>DB2-Familie (DB2, Informix, DB2 for z/OS, DB2 for iSeries) </li></ul></ul><ul><ul><li>WS Information Integrator relational data sources (Oracle, Informix, MS SQL Server, Sybase) </li></ul></ul><ul><li>Federierte Suche auf LDAP und JDBC (DB2) </li></ul>Intelligente übergreifende Suche möglich mit IBM OmniFind II Standard Edition Content Manager QuickPlace Domino Domino.doc MS Exchange Windows File System Unix File System Websites Newsgroups Weitere über API II Content Edition SQL Server Document manager Portal Portal Content Services P8 II Classic Federation for z/OS MS SharePoint
    36. 36. Konnektoren – einige Beispieldatenquellen <ul><li>Lotus Notes </li></ul><ul><ul><li>Sicherheit bis auf Dokument-Level gewährleistet </li></ul></ul><ul><ul><li>Konfiguration der für die Suche zu berücksichtigenden Notesfelder </li></ul></ul><ul><ul><li>Auswahl der Notesdaten über Ansichten oder Ordner </li></ul></ul><ul><ul><li>DIIOP (Domino Internet Inter-ORB Protokoll) </li></ul></ul><ul><ul><li>Oder NRPC (Notes Remote Procedure Call) </li></ul></ul><ul><li>FileNet Archiv </li></ul><ul><ul><li>Gewährleistung von Benutzerrechten </li></ul></ul><ul><ul><li>OmniFind agiert wie ein FileNet Client </li></ul></ul><ul><ul><li>Konfiguration der Content Klassen </li></ul></ul><ul><ul><li>Konfiguration der für die Suche zu berücksichtigenden Klassen, Felder </li></ul></ul><ul><li>SAP ist anbindbar über… </li></ul><ul><ul><li>NetWeaver Knowledge Management Search Service </li></ul></ul><ul><ul><li>SAP JCo Adapter </li></ul></ul><ul><ul><li>IBM WebSphere Adapter für SAP </li></ul></ul><ul><ul><li>Indirekt über Content-/ Archivierungssystem </li></ul></ul><ul><ul><li>SAP Data Stage </li></ul></ul><ul><li>Datenbanksysteme </li></ul><ul><ul><li>z.B. DB2, Oracle, SQL Server etc. </li></ul></ul><ul><ul><li>IBM JDBC, ODBC Konnektor </li></ul></ul><ul><ul><li>Bereitstellen der Daten über Views </li></ul></ul><ul><ul><li>Einhaltung von Benutzerrechten möglich </li></ul></ul>Intelligente übergreifende Suche möglich mit IBM OmniFind
    37. 37. Portal Integration “ auf dem Bildschirm” Projekt-Management Dokumenten-Management Diskussionsforen Content Management Web Services Syndicated Content <ul><li>Navigation </li></ul><ul><li>Single Sign On </li></ul><ul><li>Personalisierung </li></ul><ul><li>Zusammenarbeit </li></ul><ul><li>Erreichbarkeitsanzeige </li></ul><ul><li>etc. </li></ul>Zusammenarbeit Portlets
    38. 38. Integration von WebSphere Portal und OmniFind <ul><li>Anstatt der Portalsuche kann OmniFind benutzt werden, oder beide werden parallel betrieben </li></ul><ul><li>Direkte Suche im Zugriff des Portal Document Managers möglich </li></ul><ul><li>Direkte Suche im Portalinhalt möglich </li></ul><ul><li>Berücksichtigung der Rechte im Portal </li></ul><ul><li>Darstellung des Suchergebnisses im entsprechenden Portlet möglich </li></ul>Intelligente übergreifende Suche möglich mit IBM OmniFind
    39. 39. OmniFind erschließt dem Portal neue Datenquellen Sicherer Zugriff auf viele Datenquellen des Unternehmens
    40. 40. Suchmöglichkeiten im Portal <ul><li>Integrierte Portalsuche </li></ul><ul><li>OmniFind Suche </li></ul><ul><li>Beide parallel </li></ul><ul><li>Ergebnis-Anzeige </li></ul><ul><ul><li>Im Portal Search Center </li></ul></ul><ul><ul><li>Im OmniFind Portlet </li></ul></ul>
    41. 41. Ausblick Semantische Suche und UIMA Unstructured Information Management Architecture
    42. 42. <ul><li>UIMA definiert eine einheitliche Schnittstelle zur Integration von Analyseschritten </li></ul><ul><ul><li>Ermöglicht Interoperabilität verschiedener Analyselösungen und Unternehmensanwendungen </li></ul></ul><ul><ul><li>Ermöglicht Integration von OpenNLP und GATE Analysemodulen </li></ul></ul><ul><ul><li>DARPA (Forschungseinrichtung des amerikanischen Verteidigungsministeriums) benutzt UIMA </li></ul></ul><ul><li>Frei verfügbares SDK zum Entwickeln und Kombinieren von Analyseschritten </li></ul><ul><ul><li>Über 7000 Downloads bislang </li></ul></ul><ul><ul><li>SDK verfügbar auf IBM AlphaWorks, Quellcode auf SourceForge </li></ul></ul><ul><li>UIMA Working Group: IBM und DARPA sind Co-Sponsoren </li></ul><ul><ul><li>Gegründet im Januar 2005 zur Weiterentwicklung von UIMA </li></ul></ul><ul><ul><li>Wichtige Vertreter aus Wissenschaft und akademischer Forschung </li></ul></ul><ul><ul><ul><li>Stanford, Carnegie Mellon, Columbia, UMASS </li></ul></ul></ul><ul><ul><li>Teilnahme von Partnern, Forschungsabteilungen von Unternehmen </li></ul></ul><ul><ul><ul><li>Sloan Kettering, Mayo Clinic, BBN Technologies, MITRE, SAIC (Object Sciences) </li></ul></ul></ul>UIMA-Intelligenzbausteine/ Annotatoren Ein neuer Standard für die Verarbeitung und Analyse von Inhalten Federführung der UIMA Entwicklung im IBM Labor Böblingen (bei Stuttgart) Tiefergehendes Know-How in Deutschland; Entwickler in ortlicher Nähe
    43. 43. Wie kommt die Intelligenz in den Text? Ein wurde gefahren TT von Sprachteile- Annotator Entitäten- Annotator Beziehungs- Annotator Peter Müller Intelligenzbausteine – UIMA Annotatoren Wird gefahren von Person Auto Verb Präp. Subjekt Auto Person
    44. 44. Zusammenfassung <ul><li>Eine intelligente Suchmaschine, die den Inhalt des Textes „versteht“ und nicht nur nach Wörtern sucht </li></ul><ul><li>Selbstlernendes System (Inhaltserkennung, Klassifizierung) </li></ul><ul><li>Zugriff auf gängige Datenbanken und Content Systeme – Ihre Datenquellen </li></ul><ul><li>Verarbeitung aller wichtigen Text- und Dateiformate (OmniFind: >200 Formate) </li></ul><ul><li>Mächtige Rechteverwaltung </li></ul><ul><li>Linguistische Verarbeitung aller wichtigen Sprachen (OmniFind: >50 Sprachen) </li></ul><ul><li>Kurze Such-/ Antwortzeiten (OmniFind: < 1 Sekunde) </li></ul><ul><li>Verarbeitung von Millionen von Dokumenten </li></ul><ul><li>Leichte Erweiterbarkeit auf andere Datenquellen durch eine klar strukturierte Java™-API </li></ul>Funktionalität, die Sie für eine intelligente Suche brauchen IBM OmniFind

    ×