2. La cifra existente de documentos en Internet, que por su
magnitud parece escapar a nuestra imaginación, ha hecho que la
solución a los problemas relacionados con la eficiencia en los
métodos de búsqueda de la información sea, hoy en día, un tema
relevante de investigación es por esta razón que se hace
inminente adquirir ciertos conocimientos acerca de estas
herramientas que nos brinda Internet como lo son los buscadores.
Son gigantescas bases de datos que contienen información sobre
cientos de miles de páginas de Internet. Se clasifican por distintos
niveles de categorías y subcategorías, facilitándonos así el
proceso de localización. Cada dirección almacenada en un
Buscador tiene asociada una serie de palabras clave, que en
definitiva, serán las que nos permitan Llegar hasta ellas. En un
buscador puedes distinguir un espacio o cuadro de texto y
diferentes categorías que nos servirán para limitar la búsqueda
según el segmento de información que más nos interese. El resto
de elementos que componen la página son, en su
mayoría, servicios de valor añadidos del Web (Ej. Correo
electrónico – Email) o publicidad que no intervienen en las
capacidades de búsqueda del sistema.
En la red se encuentra mucha información útil, pero no siempre es
la que deseamos. Un buscador va a identificar el término pero no
el contenido del web, por tanto, si deseas limitar tu búsqueda a
información más específica, debes utilizar métodos avanzados de
búsqueda.
3. Índices temáticos: Son sistemas de búsqueda por temas o
categorías jerarquizados (aunque también suelen incluir sistemas
de búsqueda por palabras clave). Tienen un directorio navegable
de temas. Dentro de cada directorio podemos encontrar páginas
relacionadas con ese tema.
Motores de búsqueda: Son sistemas de búsqueda por palabras
clave. Son bases de datos que incorporan automáticamente
páginas web mediante "robots" de búsqueda por la red. El rastreo
de la web lo hace un programa, llamado araña ó motor (de ahí
viene el nombre del tipo de buscador). Este programa va
visitando las páginas y, a la vez, creando una base de datos en la
que relaciona la dirección de la página con las 100 primeras
palabras que aparecen en ella. Como era de esperar, el acceso a
esta base de datos se hace por palabras clave
4. Metabuscadores o multibuscadores: No tienen una base de
datos propia, lo que hacen es buscar la página en unos
cuantos motores de búsqueda e índices y combinar los
resultados de la búsqueda en esos buscadores. Un ejemplo
de metabuscador es Metacrawler.
Metabuscadores: Lo que hacen, es realizar búsquedas en
otros sitios, analizan los resultados de la página, y presentan
sus propios resultados.
No suelen ser bien venidos por los portales. Para utilizar los
servicios gratuitos de un buscador de esta forma, es
necesario pedir permiso. El motivo es el siguiente:
El Buscador, pone el dinero para opera el servicio, los
contenidos que utilizará el metabuscador, y no percibe nada
a cambio. Al eliminar la publicidad, no se obtienen ingresos.
Solo gasto y pérdida de visitantes que utilicen este servicio
de búsqueda.
Los Spiders: La mayoría de grandes sitios internacionales
que todos usamos y conocemos son de este tipo. Requieren
muchos recursos para su funcionamiento. No están al
alcance de cualquiera.
5. Los Directorios: Una barata tecnología, que es ampliamente utilizada por
la cantidad de programas scripts en el mercado. No se requieren muchos
recursos de informática. Están muy extendidos en la red por estos
motivos. En cambio, se requiere más soporte humano y mantenimiento.
Los sistemas mixtos Buscador - Directorio: Son una mezcla entre spider
y directorio. Además de tener características de arañas, presentan las
webs registradas en catálogos sobre contenidos.
Informática, cultura, sociedad. Que a su vez se dividen en subsecciones.
Buscadores de Portal: Bajo este título, se engloban los sistemas específicos
de sitio. Aquellos que buscan información solo en su portal o sitio web.
Podrían considerarlos como un directorio. No obstante, como están
basados en expresiones regulares y consultas SQL.
http://cai.bc.inter.edu/tecnicas_de_busqueda_en_internet.
htm
http://www.buscarportal.com/articulos/motores_busqued
a.html
6. Por lógica Booleana se entiende ciertas operaciones lógicas que son
utilizadas en las bases de datos para los procesos de búsquedas. En
estos procesos se utilizan también relaciones entre descriptores tales
como "ADJACENT" y "NEAR".
Los siguientes son operadores lógicos boléanos:
AND Ambos descriptores deben estar presentes. Ejemplo: Brasil AND
educación OR Puede estar una sola palabra o concepto presente, o
pueden estar ambos. Ejemplo: “educación postgraduada” OR
postgrado. NOT Excluye conceptos. Ejemplo: educación NOT
distancia. La palabra o el concepto "distancia "queda excluido.
El operador “AND” lo podemos representar por el área común (color
gris en la gráfica) que comparten ambos conceptos o descriptores.
Como resultado de la búsqueda al utilizar este operador, se obtendrán
sólo los documentos que incluyan los dos descriptores.
También se utilizan signos como “+” o “-“, denominados operadores
boléanos implícitos. El signo “+”tiene el sentido del “AND” y el signo
“-“ excluye el concepto que tenga dicho signo delante. Cuando no se
sitúan los signos “+” o el “-“ se considera por el motor de búsqueda
que estamos ante un “OR”. Estos signos: “+” y “-“, se utilizan en
búsquedas poco complejas.
7. Para precisar la búsqueda podemos utilizar las comillas "" entre las
palabras o conceptos empleados en la búsqueda. Esto indica que
queremos aquellos sitios y páginas que concuerden exactamente con lo
que hemos escrito. Las comillas (“”) indican que deben respetarse el
orden de las palabras y el empleo de las mayúsculas y minúsculas. De
esta forma, no es lo mismo "Educación a Distancia"
que "educación a distancia".
El asterisco " * " se comporta como una especie de comodín en las
búsquedas, de modo que si escribimos: Foto*, el buscador incluirá en el
resultado de la búsqueda términos como Fotógrafo, Fotográfica,
Fotomecánica, etcétera
La lógica booleana es una lógica de conjuntos y nos sirve,
principalmente, para definir formas de intersección entre conjuntos.
En este caso, los conjuntos serian lo que quedan definidos por una
palabra, es decir, serian conjuntos definidos por intensión. Si uso la
palabra "psicoanálisis", esta recubre todo el conjunto de elementos, para
el caso, páginas web, en las que dicha palabra se encuentre incluida. Así,
a partir de diferentes palabras se definen conjuntos de páginas agrupadas
por el hecho de incluir (o no) esa determinada palabra. Estos conjuntos
tendrán, entre si, elementos en común, y elementos que no. Una manera
de precisar o afinar nuestra búsqueda consistirá en utilizar estos
operadores booleanos para precisar el campo de nuestro interés.
8. Las principales opciones como se mencionaba anteriormente son:
OR - se suman los conjuntos definidos por dos palabras, es decir, la respuesta será todas
aquellas referencias donde aparezcan, indistintamente, UNA U OTRA de las palabras
indicadas para búsqueda.
AND - se trata de la intersección de los conjuntos definidos por las dos palabras, es
decir, solo aquellas referencias que contengan AMBAS palabras a la vez
NOT - en este caso, aquellas referencias que tengan la primera palabra y no la segunda, es
decir, un primer conjunto, amputado de su parte común con otro. La principal utilidad que
puede tener la opción NOT es la de eliminar todas las referencias de algún tipo de dominio:
por ejemplo, si pensamos que nuestra búsqueda supone páginas puramente académicas y
que muy difícilmente pueda encontrarse en algún sitio web comercial, al poner "NOT .com"
nos ahorraremos todas las referencias que hayan sido inicialmente seleccionadas por
contener palabras con la misma raíz que aquellas que estamos usando para realizar una
búsqueda.
NEAR - La utilidad de NEAR, que por otra parte está implementada en muy pocos
lugares, nos permite buscar en forma mas precisa definiciones compuestas. Por ejemplo, no
nos va a dar lo mismo si buscamos por "neurosis" y "obsesiva" con AND que con NEAR. En
el primer caso tendremos todas las referencias donde se hable de neurosis y de obsesión;
pero no serán, forzosamente, referencias a la neurosis obsesiva. Es mas probable que
obtengamos mejores resultados usando el NEAR.
http://psiconet.com/enlaces/internet/boole.htm