1. Benemérita Universidad Autónoma de Puebla.
Facultad de Ciencias de la Computación.
Desarrollo de Habilidades en el uso de
Tecnologías de la Información y la
Comunicación.
(DHTIC)
Tema: Estrategias de búsqueda en la web y
conceptos relacionados.
2. Algunos conceptos
Directorio: Una tecnología barata, ampliamente utilizada por gran
cantidad de scripts en el mercado. Los algoritmos son mucho más
sencillos, presentando la información sobre los sitios registrados
como una colección de directorios. No recorren los sitios web ni
almacenan sus contenidos. Solo registran algunos de los datos de
nuestra página, como el título y la descripción que se introduzcan al
momento de registrar el sitio en el directorio.
Los resultados de la búsqueda, estarán determinados por la
información que se haya suministrado al directorio cuando se registra
el sitio. En cambio, a diferencia de los motores, son revisadas por
operadores humanos, y clasificadas según categorías, de forma que
es más fácil encontrar páginas del tema de nuestro interés.
Más que buscar información sobre contenidos de la página, los
resultados serán presentados haciendo referencia a los contenidos y
temática del sitio.
Su tecnología es muy barata y sencilla.
Ejemplos de directorios: antiguos directorios, open directory project,
yahoo!, terra.
3. Motor de búsqueda: Un motor de búsqueda, también
conocido como buscador, es un sistema informático que busca
archivos almacenados en servidores web.
Las búsquedas se hacen con palabras clave o con árboles jerárquicos
por temas; el resultado de la búsqueda es un listado de direcciones
web en los que se mencionan temas relacionados con las palabras
clave buscadas.
Como operan en forma automática, los motores de búsqueda
contienen generalmente más información que los directorios. Sin
embargo, estos últimos también han de construirse a partir de
búsquedas (no automatizadas) o bien a partir de avisos dados por los
creadores de páginas (lo cual puede ser muy limitante).
4. Metabuscadores: Permite lanzar varias búsquedas en
motores seleccionados respetando el formato original de los
buscadores. Lo que hacen, es realizar búsquedas en auténticos
buscadores, analizan los resultados de la página, y presentan sus
propios resultados, según un orden definido por el sistema
estructural del metabuscador.
El metabuscador es un sistema que localiza información en los
motores de búsqueda más usados y carece de base de datos propia y,
en su lugar, usa las de otros buscadores y muestra una combinación
de las mejores páginas que ha devuelto cada uno. Un buscador
normal recopila la información de las páginas mediante su
indexación, como google o bien mantiene un amplio directorio
temático, como yahoo. La definición simplista sería que un
metabuscador es un buscador en buscadores. La principal de los
metabuscadores es que amplían de forma notoria el ámbito de las
búsquedas que realizamos, proporcionando mayor cantidad de
resultados.
Una de las desventajas importantes es que, mientras que cada
buscador dispone de su propia sintaxis de búsqueda, los
metabuscadores no distinguen entre las diferentes sintaxis.
5. Agente inteligente: Un agente inteligente es un programa
especialmente concebido para realizar ciertas tareas de manera
autónoma en una red por encargo de un usuario. Esta herramienta
permite ganar tiempo en la vigilancia y la colecta de información de
interés.
Todas las fuentes de información accesibles en una red (por lo
general internet) pueden ser vigiladas por un agente inteligente:
archivos, páginas web, bases de datos, foros, newsletters, etc.
Tres características fundamentales de los agentes inteligentes:
1. La inteligencia: el agente sabe razonar y aprende a partir de la
información que recoge
2. La interactividad: el agente puede interactuar con su entorno y
otros agentes con el propósito de realizar una tarea
3. La autonomía: el agente puede tomar decisiones de manera
autónoma.
6. Listas de distribución RSS: RSS son las siglas de
(really simple syndication o rich site summary - distribución
realmente simple o sumario de sitio rico), un formato de texto, bajo el
estándar XML, que sirve para distribuir titulares de noticias y
contenidos por internet de una forma automática.
Se trata de un pequeño fichero de texto, albergado en el servidor del
sitio web que ejerce de fuente de noticias, y donde los editores del
sitio web colocan, de una forma ordenada y estructurada, los titulares
que han publicado en su web.
Los archivos RSS permiten conocer las actualizaciones de un sitio
web de una manera rápida y sencilla, sin necesidad de entrar en dicha
página web
7. Conectores lógicos: Los conectores lógicos son
palabras o expresiones que marcan la relación entre ideas. Se
suelen situar al principio o cerca del inicio de la oración para
indicar su relación lógica con la anterior. Sirven para indicar
diferentes tipos de relación entre las oraciones que integran el
párrafo y para pasar de un párrafo a otro, por ello han de
seleccionarse cuidadosamente
Para obtener mejores resultados en la web, puedes realizar lo
siguiente:
1.- Ponle comillas a las palabras que escribas, para obtener
resultados en los cuales existan las palabras que escribiste. Por
ejemplo: “gato”.
2.- Otro consejo es que ingreses las palabras clave al cuadro de
búsqueda, sin importar que lo que escribas tenga coherencia.
Por ejemplo: gato nadar pez y ello le dará resultados, pero si
quiere mejores resultados utilice el punto anterior .
Recuerde: Que a mayor numero de palabras en el cuadro de
búsqueda …menores y escasos serán los resultados.
8. Reglas o normas para una mejor
búsqueda:
Saber que se busca.
Existen 3 tipos de búsqueda: por palabras clave, por
materia o tópico y por campo.
Eliminar palabras no necesarias.
Leer la información y desechar lo no útil.
Buscar un mismo concepto con diversas palabras clave.