1. Maestría en Entornos Virtuales
de Aprendizaje
Web Semántica
Análisis de Buscadores Semánticos
Actividad 4
Vanesa Salinas Quiroga
Cohorte 2013
2. Objetivos
• Análisis de funcionamiento de 3 buscadores semánticos y
elaboración de una valoración personal.
• Buscadores semánticos seleccionados:
▫ Hakia
▫ WolframAlpha
▫ Duckduckgo
• Concepto buscado (en inglés):
3. www.hakia.com
• Fundada en 2004 y financiada por inversores institucionales privados. Oficinas
centrales en Manhattan, posee sus datacenters en la ciudad de Nueva York,
Maryland y Tennessee. General Web Search
• Es un motor de búsqueda web que se encuentra enfocado en otorgar resultados de
calidad en todos los segmentos. Algunas búsquedas son procesadas por la
tecnología semántica propietaria de Hakia, llamada ODEXing (Deep Semantics)
mientras que otras son procesados por la tecnología SemanticRank, utilizando feeds
de APIs de terceras partes.
Hakia tambien ofrece:
▫ Aerohakia: especialmente adaptado par la industria aeroespacial, ofrece velocidad y exactitud
en la búsqueda de información crítica.
▫ Finanzas: MoodTRADE.com es una herramienta de inversiones que que aprovecha una
tecnología innovadora para permitir al inversor evaluar instantáneamente el carácter y el
impacto de toda la información disponible
▫ Investigaciones médicas: motor de búsqueda que realiza la búsqueda en mas de 20 millones
de documentos médicos en la base de datos Pubmed.
Fuente: http://company.hakia.com/about.html
4.
5. Resultados de la búsqueda
Hakia
En la primera página de resultados, considerando la Web, lanza
enlaces a sitios de empresas o noticias relacionadas al concepto a
buscar. El concepto de Emerging Technologies en Wikipedia
aparece en el 5º lugar.
Si se selecciona la opción News, las primeras cuatro noticias se
relacionan con el concepto buscado, y el resto son noticias
relacionadas
La opción de Blog lanza resultados que corresponden a la
búsqueda realizada en el 100% de los casos.
Las opciones Images y Twitter también arrojaron resultados que
corresponden a la búsqueda
6. www.wolframalpha.com
Wolfram Alpha realiza la búsqueda utilizando dinámicos basados en una vasta
colección de built-in data, algoritmos y métodos.
Componentes
Análisis linguístico
Mas de 10 trillones de datos de fuentes primarias con actualizaciones constantes
Cálculos dinamicos: Mas de 50.000 tipos de algoritmos y ecuaciones
Presentacion: mas de 5000 tipos de salida visual y tabular
Plataformas
Wolframalpha.com
API
Aplicaciones móviles
ebooks
web widgets
Fuente: http://www.wolframalpha.com/about.html
7.
8. Resultados de la búsqueda
Wolphram Alpha
• No reconoce la búsqueda de Emerging. Sugiere la utilización de la
palabra technologies.
• Como alternativa, incluye una amplia lista de conceptos
relacionados con la tecnología en una gran gama de disciplinas.
• Si aceptamos la sugerencia de buscar sólo la palabra technologies,
la variedad de respuestas es muy rica y variada.
9. www.duckduckgo.com
DuckDuckGo es un motor de búsqueda establecido en Pensilvania, Estados
Unidos.Utiliza la información de sitios de origen público (como Wikipedia) con el
objetivo de aumentar los resultados tradicionales y mejorar la relevancia.
La filosofía de DuckDuckGo hace hincapié en la privacidad y en no registrar la
información del usuario.
Está basado primordialmente en la API de los principales motores de búsqueda
(como Yahoo) debido a esto Techcrunch caracteriza al servicio como un motor de
búsqueda híbrido.
En julio del 2010, Duck Duck Go habilitó una página web para permitir a la
comunidad de usuarios denunciar los problemas, estudiar los medios de difusión de
búsqueda y examinar las características de su código abierto.
Fuente: http://es.wikipedia.org/wiki/DuckDuckGo
10.
11. Resultados de la búsqueda
Duckduckgo
• Destacado en la parte superior, presenta una definición del concepto
buscado, mostrando un enlace a Wikipedia para mas información.
• Sugiere una amplia lista de conceptos relacionados a la búsqueda.
• Inmediatamente debajo, muestra el resultado en links relacionados al
concepto buscado, de la más amplia variedad de campos de aplicación:
educación, comercial, investigación, etc.
• Sugerencias de búsqueda: en la parte derecha de la pantalla, donde los
resultados pueden filtrarse de acuerdo a lo que se requiera: las pruebas
realizadas con los filtros de “Research” y “Development” arrojaron enlaces
solo relacionados con estos conceptos, lo que mejoró ampliamente el
resultado.
12. www.google.com
Google Inc. es la empresa propietaria de la marca Google, cuyo principal producto
es el motor de búsqueda de contenido en Internet del mismo nombre.
En él se pueden realizar búsquedas de webs por la World Wide Web a base de un
algoritmo exclusivo.
En 2012, Google ha iniciado su nuevo proyecto llamado Knowledge Graph en
relación a búsquedas semánticas en Google, utilizando avanzadas estrategias
dentro de su algoritmo, mediante el cual intenta ofrecerle inteligencia artificial al
motor para entregar contenido aun mas especifico y relevante a lo acostumbrado.
Fuente: http://es.wikipedia.org/wiki/Google
13.
14. Resultados de la búsqueda
Google
Mostrando 10 primeros resultados en lo que se refiere a búsqueda web,
arroja enlaces relacionados al concepto buscado, listas y rankings de
tecnologías emergentes, noticias, entre otros. También incluye imágenes.
Sugiere búsquedas relacionadas de acuerdo al campo de aplicación.
También se puede buscar por Videos, Blogs, Libros y otras opciones.
Cuenta con herramientas de búsqueda que pueden ser de utilidad al
momento de ordenar resultados, incluyendo ubicación.
15. Valoración personal
• Los buscadores semánticos son en su mayoría fáciles de utilizar, con
interfases de usuario similares a las que estamos habituados.
• En el concepto seleccionado, “emerging technologies”, los mejores
resultados se obtuvieron utilizando el buscador semántico
Duckduckgo.
• El buscador semántico Wolfram Alpha no arrojó resultados exitosos al
buscar el concepto.
• El buscador generalista Google arrojó resultados acordes a lo
solicitado, cuenta con herramientas potentes de búsqueda, incluyendo
ubicación en la información encontrada.
• En los buscadores semánticos analizados, ninguno presentó cantidad
de resultados ni tiempo de búsqueda.
16. Recomendaciones
• Los buscadores semánticos se encuentran aún en desarrollo y
existen tecnologías que se encuentran en fase de prueba, por lo
que nuevas herramientas pueden aparecer y las ya existentes
mejorar su performance en un futuro no muy lejano.
• Algunos buscadores semánticos actuales sugieren ser mejores en
términos de organización de resultados y herramientas de
búsqueda. También existe uno de código abierto.
• Google está realizando ajustes a su motor de búsqueda de modo a
incorporar búsquedas semánticas, por lo que no puede descartarse
que en un futuro cercano proporcione resultados cada vez mas
orientados al lenguaje natural.