SlideShare ist ein Scribd-Unternehmen logo
Semantische Recherche  vs.  Boolesche Recherche Caterina Dauvergne  Lexis Nexis
Über LexisNexis IP-Lösungen   ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Teil 1: Boolesche Recherche ,[object Object],[object Object],[object Object],[object Object],[object Object]
“  Finden was du suchst … auch wenn du nicht sicher bist was du suchst und wenn du nicht weißt was du nicht weißt  ”
Die Ziele der Recherche   low hoch Ausfall quote tief hoch Die Mittel der Zielerreichung haben sich verändert  : Distributed Semantic Searching   Maschinelles Erlernen /Semantik Inferenz  Automatic Query Generation ,[object Object],[object Object],[object Object],[object Object],Genauigkeit
Herausforderungen beim Information-Retrieval - SPRACHE Cell Polysemie  – Mehrdeutigkeit von einzelnen Worten und Phrasen, wie: ,[object Object],[object Object],[object Object],[object Object],[object Object],Electrolytic Cell Cell Phone Cell Biology Voltaic Cell Terrorist Cell Baby Infant Sick Unwell Buy Purchase ► Synonimie  –  unterschiedliche Wörter mit derselben Bedeutung, wie :
Herausforderungen bei Informations-Retrieval:  RECHERCHE-SYSTEME Statische Recherche und Intelligenz Stand der Technik benötigt die Benutzung von  Lexika,Synonymen und Thesaurus. Die Recherche leidet an Chronische Amnesie, Der Rechercheur  wiederholt dieselbe Recherche mehrmals  Recherche ist zeitraubend   Unterschiedliche Systeme  Unterschiedlichen Suchsprachen und Operatoren  Keine Verbindungen Keine Standardisierung in den Recherche-Systemen  Vielzahl von technischen Systemen Vielzahl von  Retrieval-Sprachen und -Verfahren  Vielzahl von verwendeten Technologien. Vielzahl von Standards Conference Papers Ranked OR PageRank Term Weights Nested Boolean Fielded Search Term Weights Nested Boolean
Teil 2  Semantische Recherche  ,[object Object],[object Object],[object Object],[object Object]
Was ist die Semantische Recherche ? ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Semantische  Recherche   bezeichnet die automatisierte Entdeckung relevanter Informationen aus Textdaten durch Erschließung der Zusammenhänge zwischen Worten und Phrasen oder Konzepten, die den Benutzer in die Lage versetzen soll, eine verbesserte Qualität der Treffer zu erfassen.
Was ist die Semantische Recherche  ? ,[object Object],[object Object],[object Object]
Herausforderungen bei der Semantischen Recherche ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Konsequenz :  Die Semantische Recherche ist kein Ersatz  für die Erfahrung in der Recherche.
  Teil 3: Einsatz von LexisNexis bei der Semantischen Recherche ,[object Object],[object Object],[object Object],[object Object]
Von der Booleschen zur Semantischen Recherche
Neues Tab fuer die Semantische Recherche  Recherche kann sowohl aus Worten, Sätzen, Paragraphen, Ansprüchen,  etc… bestehen. Auswahl  : Semantische Recherche mit /ohne Konzeptanalysen- anzeige  Boolesche Recherche bleibt als Auswahl beibhalten TotalPatent: Semantische Recherche
Begriffswolke  Worte und Phrasen die durch Inferenz des semantischen „Gehirns“ bestimmt werden. Größe und die Farbe der entstandenen  Worte bezeichnen das Ranking der Worte innerhalb der Recherche Die Text-Darstellung und deren Gewicht in der Recherche wird wiedergegeben TotalPatent: Semantische Recherche
Ein Klick  auf  jedes der Worte gibt dem Nutzer die Möglichkeit, die Wichtigkeit der Zuordnung des Begriffs im Ranking  zu erkennen/zu bestimmen als auch ausgewählte Worte aus der Recherche auszuschließen.  TotalPatent: Semantische Recherche
Einfügen  von zusätzlichen Konzepten durch den Nutzer. TotalPatent: Semantische Recherche
Hier  kann man sehen, wie die Semantische Rechercheoberfläche aussieht, nachdem die Semantische Analyse stattgefunden hat und die Konzepte für die Recherche sowohl vom Nutzer als auch von der DDS verarbeitet worden sind.  TotalPatent: Semantische Recherche
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],TotalPatent: Semantische Recherche
Die  Treffermenge des 1. Suchschrittes kann durch weitere Schlüsselwörter semantisch weiter verfeinert werden. TotalPatent: Semantische Recherche
TotalPatent: Semantische Recherche
[object Object],[object Object],[object Object],[object Object]

Weitere ähnliche Inhalte

Andere mochten auch

Uzh ts k_lehrportfolio
Uzh ts k_lehrportfolioUzh ts k_lehrportfolio
Uzh ts k_lehrportfolioFutter Kathrin
 
Presentación
PresentaciónPresentación
Presentación
Bruno Mina Argueta
 
Introduccion al software
Introduccion al softwareIntroduccion al software
Introduccion al software
diegocuestas01
 
Social Media Marketing für Tourismusorganisationen
Social Media Marketing für TourismusorganisationenSocial Media Marketing für Tourismusorganisationen
Social Media Marketing für Tourismusorganisationenxeit AG
 
el domicilio como factor de conexion.
el domicilio como factor de conexion.el domicilio como factor de conexion.
el domicilio como factor de conexion.
Hugo Litoriano
 
24 Jesus - Mit dem Allmächtigen im Alltäglichen
24 Jesus - Mit dem Allmächtigen im Alltäglichen24 Jesus - Mit dem Allmächtigen im Alltäglichen
24 Jesus - Mit dem Allmächtigen im AlltäglichenDominique Pfeiffer
 
Cartilla de ciencia políticas 3 periodo.
Cartilla de ciencia políticas 3 periodo.Cartilla de ciencia políticas 3 periodo.
Cartilla de ciencia políticas 3 periodo.
Andres Sebastian Zambrano
 
Reporte2
Reporte2Reporte2
Presentación trabajo de grado tics
Presentación trabajo de grado ticsPresentación trabajo de grado tics
Presentación trabajo de grado tics
Aquileovelez
 
Documentofinalproyecto20101 100520230239-phpapp01
Documentofinalproyecto20101 100520230239-phpapp01Documentofinalproyecto20101 100520230239-phpapp01
Documentofinalproyecto20101 100520230239-phpapp01
Nasli Lizarazo
 
Innovación zona desarrollo proximo Faiber Bermeo
Innovación zona desarrollo proximo Faiber BermeoInnovación zona desarrollo proximo Faiber Bermeo
Innovación zona desarrollo proximo Faiber Bermeo
faiferbermeo
 
Análisis de propaganda
Análisis de propagandaAnálisis de propaganda
Análisis de propaganda
Rebecca Chavez
 
Trabajo colaborativo aplicación matrimaticas
Trabajo colaborativo aplicación matrimaticasTrabajo colaborativo aplicación matrimaticas
Trabajo colaborativo aplicación matrimaticas
bguzmana
 
El domicilio como factor de conexión dl
El domicilio como factor de conexión dlEl domicilio como factor de conexión dl
El domicilio como factor de conexión dl
dilialeon73
 
Practica del procesador 1
Practica del procesador 1Practica del procesador 1
Practica del procesador 1
manuel35lna54321gfdsaxvbf
 
Eingangs - Rechnungsprüfung schneller und damit gewinnbingend fürs Unternehme...
Eingangs - Rechnungsprüfung schneller und damit gewinnbingend fürs Unternehme...Eingangs - Rechnungsprüfung schneller und damit gewinnbingend fürs Unternehme...
Eingangs - Rechnungsprüfung schneller und damit gewinnbingend fürs Unternehme...
HENRICHSEN AG
 

Andere mochten auch (17)

Uzh ts k_lehrportfolio
Uzh ts k_lehrportfolioUzh ts k_lehrportfolio
Uzh ts k_lehrportfolio
 
Presentación
PresentaciónPresentación
Presentación
 
Introduccion al software
Introduccion al softwareIntroduccion al software
Introduccion al software
 
Social Media Marketing für Tourismusorganisationen
Social Media Marketing für TourismusorganisationenSocial Media Marketing für Tourismusorganisationen
Social Media Marketing für Tourismusorganisationen
 
el domicilio como factor de conexion.
el domicilio como factor de conexion.el domicilio como factor de conexion.
el domicilio como factor de conexion.
 
24 Jesus - Mit dem Allmächtigen im Alltäglichen
24 Jesus - Mit dem Allmächtigen im Alltäglichen24 Jesus - Mit dem Allmächtigen im Alltäglichen
24 Jesus - Mit dem Allmächtigen im Alltäglichen
 
Cartilla de ciencia políticas 3 periodo.
Cartilla de ciencia políticas 3 periodo.Cartilla de ciencia políticas 3 periodo.
Cartilla de ciencia políticas 3 periodo.
 
Reporte2
Reporte2Reporte2
Reporte2
 
Presentación trabajo de grado tics
Presentación trabajo de grado ticsPresentación trabajo de grado tics
Presentación trabajo de grado tics
 
Documentofinalproyecto20101 100520230239-phpapp01
Documentofinalproyecto20101 100520230239-phpapp01Documentofinalproyecto20101 100520230239-phpapp01
Documentofinalproyecto20101 100520230239-phpapp01
 
Schreibtest
SchreibtestSchreibtest
Schreibtest
 
Innovación zona desarrollo proximo Faiber Bermeo
Innovación zona desarrollo proximo Faiber BermeoInnovación zona desarrollo proximo Faiber Bermeo
Innovación zona desarrollo proximo Faiber Bermeo
 
Análisis de propaganda
Análisis de propagandaAnálisis de propaganda
Análisis de propaganda
 
Trabajo colaborativo aplicación matrimaticas
Trabajo colaborativo aplicación matrimaticasTrabajo colaborativo aplicación matrimaticas
Trabajo colaborativo aplicación matrimaticas
 
El domicilio como factor de conexión dl
El domicilio como factor de conexión dlEl domicilio como factor de conexión dl
El domicilio como factor de conexión dl
 
Practica del procesador 1
Practica del procesador 1Practica del procesador 1
Practica del procesador 1
 
Eingangs - Rechnungsprüfung schneller und damit gewinnbingend fürs Unternehme...
Eingangs - Rechnungsprüfung schneller und damit gewinnbingend fürs Unternehme...Eingangs - Rechnungsprüfung schneller und damit gewinnbingend fürs Unternehme...
Eingangs - Rechnungsprüfung schneller und damit gewinnbingend fürs Unternehme...
 

Ähnlich wie Patinfo09

Die Loesung - Turbo iXtractor -
Die Loesung - Turbo iXtractor -Die Loesung - Turbo iXtractor -
Die Loesung - Turbo iXtractor -
Jens Schwartz-Freiberg
 
Drupal-basierte Infrastruktur zur Vermittlung von Fachterminologie. Das Konz...
Drupal-basierte Infrastruktur zur Vermittlung von  Fachterminologie. Das Konz...Drupal-basierte Infrastruktur zur Vermittlung von  Fachterminologie. Das Konz...
Drupal-basierte Infrastruktur zur Vermittlung von Fachterminologie. Das Konz...
Mediencommunity 2.0
 
Ontologien für Fachportale - Voraussetzungen und Nutzenpotentiale
Ontologien für Fachportale - Voraussetzungen und NutzenpotentialeOntologien für Fachportale - Voraussetzungen und Nutzenpotentiale
Ontologien für Fachportale - Voraussetzungen und NutzenpotentialeAndreas Schmidt
 
Von Benennungen über Begriffssysteme hin zu Ontologien - Ein weiter Weg?
Von Benennungen über Begriffssysteme hin zu Ontologien - Ein weiter Weg?Von Benennungen über Begriffssysteme hin zu Ontologien - Ein weiter Weg?
Von Benennungen über Begriffssysteme hin zu Ontologien - Ein weiter Weg?
Kerstin Berns
 
Linked Library Data & RDA
Linked Library Data & RDALinked Library Data & RDA
Linked Library Data & RDA
Alexander Haffner
 
Aktuelle Trends der Wissensrepraesentation
Aktuelle Trends der WissensrepraesentationAktuelle Trends der Wissensrepraesentation
Aktuelle Trends der Wissensrepraesentation
Katrin Weller
 
Metadaten in SharePoint Deutsch
Metadaten in SharePoint   DeutschMetadaten in SharePoint   Deutsch
Metadaten in SharePoint Deutsch
Dave Maskell
 
A2 DPC Knowledege Wissen Griffbereit 2007 Lotusday 2007
A2 DPC Knowledege Wissen Griffbereit 2007 Lotusday 2007A2 DPC Knowledege Wissen Griffbereit 2007 Lotusday 2007
A2 DPC Knowledege Wissen Griffbereit 2007 Lotusday 2007
Andreas Schulte
 
Wissensrepräsentation im Social Semantic Web
Wissensrepräsentation im Social Semantic WebWissensrepräsentation im Social Semantic Web
Wissensrepräsentation im Social Semantic Web
Katrin Weller
 
Integrationsansätze: Überblick und Potentiale semantischer Technologien
Integrationsansätze: Überblick und Potentiale semantischer TechnologienIntegrationsansätze: Überblick und Potentiale semantischer Technologien
Integrationsansätze: Überblick und Potentiale semantischer Technologien
Andreas Schmidt
 
Kollaborative Projekte mit Watson Explorer
Kollaborative Projekte mit Watson ExplorerKollaborative Projekte mit Watson Explorer
Kollaborative Projekte mit Watson Explorer
Paradigma Consulting
 
Wir machen Terminologie
Wir machen TerminologieWir machen Terminologie
Wir machen Terminologie
yellowcow
 
Alternative Methoden für die Analyse von Freitextantworten im E-Learning. Ne...
Alternative Methoden für die Analyse von Freitextantworten im E-Learning.  Ne...Alternative Methoden für die Analyse von Freitextantworten im E-Learning.  Ne...
Alternative Methoden für die Analyse von Freitextantworten im E-Learning. Ne...
Marco Kalz
 
Linked Open Data in digitalen Bibliotheken
Linked Open Data in digitalen BibliothekenLinked Open Data in digitalen Bibliotheken
Linked Open Data in digitalen Bibliotheken
Alexander Haffner
 
Web-2.0-Forschung der KWARC-Gruppe
Web-2.0-Forschung der KWARC-GruppeWeb-2.0-Forschung der KWARC-Gruppe
Web-2.0-Forschung der KWARC-Gruppe
Christoph Lange
 
Generische Datenintegration zur semantischen Diagnoseunterstützung im Projekt...
Generische Datenintegration zur semantischen Diagnoseunterstützung im Projekt...Generische Datenintegration zur semantischen Diagnoseunterstützung im Projekt...
Generische Datenintegration zur semantischen Diagnoseunterstützung im Projekt...
Florian Stegmaier
 
Enterprise Search: Potenziale und Fallstricke
Enterprise Search: Potenziale und FallstrickeEnterprise Search: Potenziale und Fallstricke
Enterprise Search: Potenziale und Fallstricke
Alexander Stocker
 
Kickoff Workshop zum Projekt amsl mit den sächsischen Hochschulbibliotheken
Kickoff Workshop zum Projekt amsl mit den sächsischen HochschulbibliothekenKickoff Workshop zum Projekt amsl mit den sächsischen Hochschulbibliotheken
Kickoff Workshop zum Projekt amsl mit den sächsischen HochschulbibliothekenLydiaU
 
AMSL Kick-off-Meeting sächsischer Hochschulbibliotheken
AMSL Kick-off-Meeting sächsischer HochschulbibliothekenAMSL Kick-off-Meeting sächsischer Hochschulbibliotheken
AMSL Kick-off-Meeting sächsischer HochschulbibliothekenBjörn Muschall
 
Kontextbasiertes Information Retrieval: Eine Systematik der Anwendungspotent...
Kontextbasiertes Information Retrieval: Eine Systematik der Anwendungspotent...Kontextbasiertes Information Retrieval: Eine Systematik der Anwendungspotent...
Kontextbasiertes Information Retrieval: Eine Systematik der Anwendungspotent...
Hendrik Kalb
 

Ähnlich wie Patinfo09 (20)

Die Loesung - Turbo iXtractor -
Die Loesung - Turbo iXtractor -Die Loesung - Turbo iXtractor -
Die Loesung - Turbo iXtractor -
 
Drupal-basierte Infrastruktur zur Vermittlung von Fachterminologie. Das Konz...
Drupal-basierte Infrastruktur zur Vermittlung von  Fachterminologie. Das Konz...Drupal-basierte Infrastruktur zur Vermittlung von  Fachterminologie. Das Konz...
Drupal-basierte Infrastruktur zur Vermittlung von Fachterminologie. Das Konz...
 
Ontologien für Fachportale - Voraussetzungen und Nutzenpotentiale
Ontologien für Fachportale - Voraussetzungen und NutzenpotentialeOntologien für Fachportale - Voraussetzungen und Nutzenpotentiale
Ontologien für Fachportale - Voraussetzungen und Nutzenpotentiale
 
Von Benennungen über Begriffssysteme hin zu Ontologien - Ein weiter Weg?
Von Benennungen über Begriffssysteme hin zu Ontologien - Ein weiter Weg?Von Benennungen über Begriffssysteme hin zu Ontologien - Ein weiter Weg?
Von Benennungen über Begriffssysteme hin zu Ontologien - Ein weiter Weg?
 
Linked Library Data & RDA
Linked Library Data & RDALinked Library Data & RDA
Linked Library Data & RDA
 
Aktuelle Trends der Wissensrepraesentation
Aktuelle Trends der WissensrepraesentationAktuelle Trends der Wissensrepraesentation
Aktuelle Trends der Wissensrepraesentation
 
Metadaten in SharePoint Deutsch
Metadaten in SharePoint   DeutschMetadaten in SharePoint   Deutsch
Metadaten in SharePoint Deutsch
 
A2 DPC Knowledege Wissen Griffbereit 2007 Lotusday 2007
A2 DPC Knowledege Wissen Griffbereit 2007 Lotusday 2007A2 DPC Knowledege Wissen Griffbereit 2007 Lotusday 2007
A2 DPC Knowledege Wissen Griffbereit 2007 Lotusday 2007
 
Wissensrepräsentation im Social Semantic Web
Wissensrepräsentation im Social Semantic WebWissensrepräsentation im Social Semantic Web
Wissensrepräsentation im Social Semantic Web
 
Integrationsansätze: Überblick und Potentiale semantischer Technologien
Integrationsansätze: Überblick und Potentiale semantischer TechnologienIntegrationsansätze: Überblick und Potentiale semantischer Technologien
Integrationsansätze: Überblick und Potentiale semantischer Technologien
 
Kollaborative Projekte mit Watson Explorer
Kollaborative Projekte mit Watson ExplorerKollaborative Projekte mit Watson Explorer
Kollaborative Projekte mit Watson Explorer
 
Wir machen Terminologie
Wir machen TerminologieWir machen Terminologie
Wir machen Terminologie
 
Alternative Methoden für die Analyse von Freitextantworten im E-Learning. Ne...
Alternative Methoden für die Analyse von Freitextantworten im E-Learning.  Ne...Alternative Methoden für die Analyse von Freitextantworten im E-Learning.  Ne...
Alternative Methoden für die Analyse von Freitextantworten im E-Learning. Ne...
 
Linked Open Data in digitalen Bibliotheken
Linked Open Data in digitalen BibliothekenLinked Open Data in digitalen Bibliotheken
Linked Open Data in digitalen Bibliotheken
 
Web-2.0-Forschung der KWARC-Gruppe
Web-2.0-Forschung der KWARC-GruppeWeb-2.0-Forschung der KWARC-Gruppe
Web-2.0-Forschung der KWARC-Gruppe
 
Generische Datenintegration zur semantischen Diagnoseunterstützung im Projekt...
Generische Datenintegration zur semantischen Diagnoseunterstützung im Projekt...Generische Datenintegration zur semantischen Diagnoseunterstützung im Projekt...
Generische Datenintegration zur semantischen Diagnoseunterstützung im Projekt...
 
Enterprise Search: Potenziale und Fallstricke
Enterprise Search: Potenziale und FallstrickeEnterprise Search: Potenziale und Fallstricke
Enterprise Search: Potenziale und Fallstricke
 
Kickoff Workshop zum Projekt amsl mit den sächsischen Hochschulbibliotheken
Kickoff Workshop zum Projekt amsl mit den sächsischen HochschulbibliothekenKickoff Workshop zum Projekt amsl mit den sächsischen Hochschulbibliotheken
Kickoff Workshop zum Projekt amsl mit den sächsischen Hochschulbibliotheken
 
AMSL Kick-off-Meeting sächsischer Hochschulbibliotheken
AMSL Kick-off-Meeting sächsischer HochschulbibliothekenAMSL Kick-off-Meeting sächsischer Hochschulbibliotheken
AMSL Kick-off-Meeting sächsischer Hochschulbibliotheken
 
Kontextbasiertes Information Retrieval: Eine Systematik der Anwendungspotent...
Kontextbasiertes Information Retrieval: Eine Systematik der Anwendungspotent...Kontextbasiertes Information Retrieval: Eine Systematik der Anwendungspotent...
Kontextbasiertes Information Retrieval: Eine Systematik der Anwendungspotent...
 

Patinfo09

  • 1. Semantische Recherche vs. Boolesche Recherche Caterina Dauvergne Lexis Nexis
  • 2.
  • 3.
  • 4. “ Finden was du suchst … auch wenn du nicht sicher bist was du suchst und wenn du nicht weißt was du nicht weißt ”
  • 5.
  • 6.
  • 7. Herausforderungen bei Informations-Retrieval: RECHERCHE-SYSTEME Statische Recherche und Intelligenz Stand der Technik benötigt die Benutzung von Lexika,Synonymen und Thesaurus. Die Recherche leidet an Chronische Amnesie, Der Rechercheur wiederholt dieselbe Recherche mehrmals Recherche ist zeitraubend Unterschiedliche Systeme Unterschiedlichen Suchsprachen und Operatoren Keine Verbindungen Keine Standardisierung in den Recherche-Systemen Vielzahl von technischen Systemen Vielzahl von Retrieval-Sprachen und -Verfahren Vielzahl von verwendeten Technologien. Vielzahl von Standards Conference Papers Ranked OR PageRank Term Weights Nested Boolean Fielded Search Term Weights Nested Boolean
  • 8.
  • 9.
  • 10.
  • 11.
  • 12.
  • 13. Von der Booleschen zur Semantischen Recherche
  • 14. Neues Tab fuer die Semantische Recherche Recherche kann sowohl aus Worten, Sätzen, Paragraphen, Ansprüchen, etc… bestehen. Auswahl : Semantische Recherche mit /ohne Konzeptanalysen- anzeige Boolesche Recherche bleibt als Auswahl beibhalten TotalPatent: Semantische Recherche
  • 15. Begriffswolke Worte und Phrasen die durch Inferenz des semantischen „Gehirns“ bestimmt werden. Größe und die Farbe der entstandenen Worte bezeichnen das Ranking der Worte innerhalb der Recherche Die Text-Darstellung und deren Gewicht in der Recherche wird wiedergegeben TotalPatent: Semantische Recherche
  • 16. Ein Klick auf jedes der Worte gibt dem Nutzer die Möglichkeit, die Wichtigkeit der Zuordnung des Begriffs im Ranking zu erkennen/zu bestimmen als auch ausgewählte Worte aus der Recherche auszuschließen. TotalPatent: Semantische Recherche
  • 17. Einfügen von zusätzlichen Konzepten durch den Nutzer. TotalPatent: Semantische Recherche
  • 18. Hier kann man sehen, wie die Semantische Rechercheoberfläche aussieht, nachdem die Semantische Analyse stattgefunden hat und die Konzepte für die Recherche sowohl vom Nutzer als auch von der DDS verarbeitet worden sind. TotalPatent: Semantische Recherche
  • 19.
  • 20. Die Treffermenge des 1. Suchschrittes kann durch weitere Schlüsselwörter semantisch weiter verfeinert werden. TotalPatent: Semantische Recherche
  • 22.

Hinweis der Redaktion

  1. Language causes problems for searchers With Boolean searching users need a lot of “qualifiers’ -- THIS and NOT THIS as well as proximity operators – ALL of which try to focus in on the real concept These are examples of this simple problem that causes a searcher a lot of headache The Yellow box gives additional common problems
  2. Semantic searching is also called Concept searching It helps the user by searching on related concepts that may not include the key words used in the actual search. As you know, patents are frequently written in a way that intentionally obfuscates the actual technology being patented . Thus, semantic searching is of high interest to this community . The technical phrase for “real” semantic searching is: latent semantic analysis or LSA . Essentially, you feed the computer tens of thousands or millions of documents and the computer creates a relationship between every word in every document. As it does so, it begins to create statistically significant connections between words and phrases (concepts) so that a user’s keywords can be expanded beyond their literal spelling to include the actual concept of interest to the searcher . Many vendors claim to have semantic searching but nearly always they’re stretching the definition of the term to include older search techniques that might be based on dictionaries, thesauri, lexicons and taxonomies. Real semantic searching does not.
  3. Here’s an example of what I mean . As I said, the computer creates these relationships and creates what is called a “vector space.” [Just as a matter of trivia, a vector space can be of any number of dimensions. Some true semantic search engines only have a few dimensions . Our semantic search engine will have in excess of 300 dimensions . ] Here is an example of the hyperspace around the word “marine.” As it built the hyperspace you notice that it recognized a close relationship between the words naval, Quantico, Corp and USMC. Similarly, but somewhat distance from that set of terms, it noticed a tight relationship between the words ecology and coastal and oceanography and oceanic . The result is that the computer can identify what concept you are talking about based on all of the other words and ways that people have discussed that same concept .
  4. Well, there are challenges to semantic searching. In short, all attempts at providing semantic search to the marketplace thus far have treated it as a “black box” that requires the user to surrender their transparency and control over the actual search. In addition, assuming for the moment that the user can get over the black box issues, the fact that the content they need to search is stored in so many places, using so many indices, some of which are under their control and some of which will never be under their control, the issue of scale becomes real. Most truly semantic engines on the market today require the vendor to host, index and perform the search on the content based on their semantic technology . This is clearly untenable In today’s growing information market. The result is that, as much as users would like to use semantic searching, they have not seen a practical implementation to date.