Este documento describe las bases de datos bibliográficas y sus características principales. Explica que las bases de datos bibliográficas consisten en colecciones de datos digitales que permiten el análisis sistemático de grandes cantidades de literatura a través del uso de herramientas web. Además, detalla los componentes clave de las bases de datos como los registros bibliográficos, campos, y operadores de búsqueda que facilitan la recuperación de información relevante.
2. E-investigación bibliográfica
• Consiste en el análisis sistémico, integral y simultáneo de grandes cantidades
de literatura electrónica disponible.
• Investigación bibliográfica basada en el uso de ciberinfraestructura y
recursos de la Web 2.0 en evolución a la 3.0 (aplicaciones, herramientas,
servicios).
• Colecciones de datos digitales (repositorios, bases de datos).
• Análisis sistémico de la literatura.
• Meta-análisis de la literatura (miles 10, 000 o 10, 000).
• Ventajas:
– Automatización
– Sistematización
– Eficiencia
– Personalización
– Actualización
– Inmediatez
3. Las colecciones de datos digitales
• Colecciones
– Se refiere a los datos almacenados, a la infraestructura, las
organizaciones y las personas necesarias para preservar el acceso a
los datos.
– Bases de datos, reservorios o repositorios.
• Datos
– De distintos tipos: texto, números, imágenes, vídeo o películas,
audio, software, algoritmos, ecuaciones, animaciones, modelos,
simulaciones, etc
– Pueden ser generados por diversos medios, entre ellos la
observación, el cálculo o experimento.
• Digitales
– Disponibles a través de Internet.
– Almacenados en formato digital.
4. BASES DE DATOS
• Según Date (1993), una base de datos es un sistema informático de registros
con el propósito de almacenar, mantener y generar información, la cual está
sistematizada en tablas con un orden establecido.
• Es decir, son programas que permiten guardar, ordenar, procesar y presentar
los datos con las siguientes ventajas:
– 1) facilitan acumular mucha información en poco espacio
– 2) sistematizan los datos de acuerdo con las necesidades del proyecto
– 3) proporcionan el acceso a la información
– 4) realizan búsquedas a partir de diferentes criterios
– 5) procesan datos de forma cuantitativa y cualitativa
– 6) interrelacionan los resultados utilizando distintas variables
– 7) actualizan la información fácil y rápidamente
– 8) son compatibles con otras bases de datos
– 9) efectúan diversos cálculos por medio de consultas (‘queries’)
– 10) se extienden por módulos
– 11) se pueden diseñar, almacenar, manejar y analizar en una computadora personal
(PC)
5.
6.
7.
8.
9. REGISTRO
• Unidad
• Representa físicamente:
– Artículo de publicación
periódica
– Libro o monografía
– Conferencia, reuniones, etc.
– Tesis
– Imagen
– Mapa
– Documento impreso,
audiovisual o electrónico
10. CAMPOS
Los registros están
compuestos por
áreas de información
conocidas como
campos:
• Autor (es)
• Título
• Lugar de edición
• Casa editora
• Descriptores, etc.
14. Colecciones de datos bibliográficas
– Sistemas de información (documental)
– Bases de datos bibliográficas
– e-bibliotecas
– e-librerias
– e-revistas
– e-libros
– e-editoriales
– E-catálogos
15. Características de las colecciones de datos bibliográficas
Característica Descripción
Editor-Productor Institución o empresa encargada del diseño, captura y publicación
Criterios de
selección de
documentos
Criterios utilizados para seleccionar los documentos que se indizarán: editoriales (corriente
principal), temática, regional, idiomática.
Cobertura
tipológica
Tipo de documentos que son capturados: artículos, memorias, libros, monografías
Campos Registro bibliográfico básico (TI, AU, AB, KW), referencias y citas, liga al texto completo,
relacionados, Indicadores bibliométricos (FI, Indice H)
Cobertura temporal Longitud de tiempo que abarcan los documentos registrados
Cobertura temática Las áreas del conocimiento y tópicos de los documentos : multidisciplinarias, ciencias biológicas y
especializadas
Fecha de inicio Fecha de origen de la base de datos
Cobertura
geográfica
Lugar de la edición de las revistas o documentos: mundial, regional o local.
Tipo de acceso Consulta libre o restringida . UNAM
Idioma Idioma de origen de las publicaciones registradas
Tamaño Memoria virtual: Teras, Gigas o megas
Número de registros indizados: millones o miles.
Número de revistas
Tesaurio Existencia de catálogo controlado: descriptores
Recursos Web 2.0 Servicio personalizado, alertas y feeds, manejador de bibliografía, recuperación de registros para
meta-análisis (cientos), exportar, url .
16. Campos
1. Registro bibliográfico
2. Liga al texto completo
3. Descriptores
4. Referencias y citas
5. Relacionados
6. Meta-análisis
1. Indicadores bibliométricos
2. Análisis de redes
3. Descubrimiento basado en literatura
17. Registro Bibliográfico
• Conjunto de datos formales que identifican y localizan un documento. Es
una representación del documento resultado de la catalogación y por tanto
un documento secundario.
• Está constituido por la referencia bibliográfica, los puntos de acceso y la
signatura topográfica de cada documento. Su finalidad es facilitar su
recuperación en un sistema de información y acceso al documento original.
• Su confección está normalizada por las Reglas de Catalogación que incluyen
la norma para la Descripción Bibliográfica Internacional Normalizada y las
directrices de la IFLA para la normalización de los puntos de acceso o
control de autoridades.
• La metodología consiste en crear un registro único para cada documento
que facilite el acceso a la información por cualquier dato de la descripción o
de los puntos de acceso, e incluso por la signatura topográfica.
Lopez Yepes, J. Diccionario enciclopédico de ciencias de la información. Madrid:
Sintesis,2004.
18. Búsqueda en una base de datos
• Características y cobertura de las bds
– Identificar las características de los registros.
– Reconocer los campos de búsqueda.
• Búsqueda simple y avanzada
• Diseño de la consulta
• Operadores lógicos
19. Etapas
1. Definir la pregunta
2. Establecer el/los dominios de interés
3. Caracterizar el/los dominios
4. Elegir los enfoques
5. Reconocer las herramientas
6. Recuperación de información
(Literatura)
7. Evaluación
20. Operadores de búsqueda más comunes
Operador Descripción Ejemplo
Boleanos
AND (en inglés) Y (en
español)
Recupera registros que tengan
todos los términos
estudiantes AND universitarios
OR (en inglés) O (en
español)
Recupera registros que tengan
cualquiera de los términos
estudiantes OR universitarios
NOT (en inglés) NO
(en español)
excluye el término
indicado para sesgar los
resultados
estudiantes NOT universitarios
Truncamiento
? Sustituye una letra o número en
cualquier posición de una
palabra o serie de números
mexican?.- mexicana,
mexicano
* Sustituye una o más
letras o números en cualquier
posición de la palabra o serie
de números
mexican*.- mexicana,
mexicano, mexicanas,
mexicanos
Proximidad
NEAR Recupera documentos en los
que los términos de búsqueda
estén cerca (máximo mil
palabras)
becas NEAR extranjero
ADJ Recupera documentos en los
que los términos estén uno
junto al otro, pueden obtenerse
los mismos resultados
entrecomillando los términos
servicio ADJ social
“ “ Recupera registros que
contengan el término exacto
“servicio social”
21. Operadores lógicos
• Y (combinación)
• O (reunión)
• Not (exclusión)
• $ ¿(truncar)
• “término exacto”
A B
22. Estrategias de búsqueda
• Búsqueda simple
• Búsqueda avanzada
• Documentos Relacionados
• Relevancia (Pagerank google)
• Valoración de los usuarios (Ranking)
• En revistas y autores seleccionados
• Revisiones
23. This diagram has been adapted from
Evolution of Scientific Information. [From
Allan Kent and Harold Lancour, eds.,
Encyclopedia of Library and Information
Science (New York, 1979), s.v. "Scientific
Literature," by K. Subramanyam, 394].
24. Consulta avanzada
Avanzada o refinada (límites)
• Campos (Dónde)
– Definir los campos de búsqueda (límites)
• Consulta
– Qué
• Dominios (disciplinas y subdisciplinas)
• Términos (específicos, homónimos, sinónimos y
relacionados)
– Cómo
• Operadores lógicos
• Truncar *¿ y “Exacto”
26. Diseño de la consulta
• Pregunta documental:
– Enfoques
– Temas
– Términos
• Recuperar documentos
– Sobre
– Con
– Acerca
– Términos en los documentos
• Elegir los artículos más representativos
– Seleccionar las palabras más comunes
– Ver palabras clave
28. • Una vez elegida la base de datos se procede al diseño de una
estrategia de búsqueda; esto es definir claramente que se desea
buscar y como.
• Para la adecuada definición de los términos se puede hacer uso
de herramientas de búsqueda como índices y tesauros así como
de operadores para que establezcan relaciones entre los
términos, los amplíen o los reduzcan.
• Los operadores sustituyen a las “palabras vacías” como
preposiciones o artículos que al ser empleados en una búsqueda
recuperan gran cantidad de resultados no deseados.
29. Problemas
• Provocados por el uso del lenguaje natural:
Silencio documental: Son aquellos documentos almacenados
en la base de datos pero que no han sido recuperados,
debido a que la estrategia de búsqueda ha sido demasiado
específica o que las palabras clave utilizadas no son las
adecuadas para definir la búsqueda.
– Ambigüedad
– Sinonimia
Ruido documental: Son aquellos documentos recuperados
por el sistema pero que no son relevantes. Esto suele ocurrir
cuando la estrategia de búsqueda se ha definido demasiado
genérica .
Homonimia
Homografía
30. Soluciones
• Hacer pruebas de búsqueda
• Utilizar sinónimos y homónimos
• Buscar en distintas bases de datos
31. Consulta avanzada
Avanzada o refinada (límites)
• Campos (Dónde)
– Definir los campos de búsqueda (límites)
• Consulta
– Qué
• Términos (específicos, homónimos, sinónimos y
relacionados)
– Cómo
• Operadores lógicos
• Truncar *¿ y “Exacto”
• Near
Curatoriales
Este módulo comprende información relacionada con la recolecta, observación y reporte bibliográfico del ejemplar (nombre científico, la colección a la cual pertenece, datos geográficos, hábitat, microhábitat, grupo de colecta, grupo de determinación, historia de determinaciones, etc.), su información biótica y abiótica organizada en su mayoría en catálogos, es posible la asociación del ejemplar con archivos externos (imágenes, sonidos, páginas WWW, hojas de cálculo, etc.). Existe un catálogo de tipos nomenclaturales (holotipo, paratipo, etc.), uno de tipos de interacción (Huésped-hospedero, mutualismo, etc.) y uno de características (físicas, hábitos, tipo de vegetación, etc.) en los cuales el usuario puede agregar los elementos que sean necesarios para la captura de su información. Además es posible definir interacciones entre ejemplares, o bien entre ejemplares y taxones. Este módulo también tiene la capacidad de manejar información relacionada con las muestras de semillas (si se selecciona al instalar el sistema o al migrar la base de datos)tal como: pruebas aplicadas a las semillas (rayos X, disección, tetrazolio y germinación), cálculo de número de semillas en la muestra y del peso de mil semillas, histórico de las muestras, datos de almacenamiento, calidad física y comportamiento, características de las muestras de semillas regeneración de la muestra de semillas, etc. Está dividido en: Catálogos de características, Tipo nomenclatural, Catálogo de interacciones, Ejemplar e Interacciones.
Nomenclaturales
Aquí se realiza la captura y actualización de los nombres científicos con su correspondiente categoría taxonómica, relaciones entre taxones (sinonimia, basonimia, etc.), asociación con archivos externos (imágenes, sonidos, páginas WWW, hojas de cálculo, etc.), nombre común, región y catálogos personalizables por el usuario que contienen características físicas, del ambiente, etc. para la nomenclatura, además de citas bibliográficas para el nombre, para la relación entre taxones y para los catálogos asociados.
Este módulo se divide en Categoría Taxonómica, Catálogo de relaciones, Catálogos de características , Nombre y Catálogos Asociados al..
Geográficos
Aquí es posible ingresar regiones (área geográfica que se define en función de sus características, por ejemplo ambientales, socioeconómicas, etc.), sitios (coordenada geográfica o área delimitada por dos coordenadas geográficas) y localidades. Estos pueden ser datos referentes a la localización geográfica de los lugares de observación, reporte o recolecta del ejemplar; a la distribución de taxones (regiones); a los nombres comunes (regiones) y al estudio poblacional (datos de la población, muestreos). Además es posible definir distribución de taxones mediante la asociación de estos con objetos geográficos (líneas, polígonos y puntos) de mapas digitalizados. Existe un catálogo de tipos de distribución (actual y original) en donde el usuario puede ingresar los tipos que sean necesarios.
Este módulo se divide en Catálogo de regiones, Catálogo de tipo de distribución, Regiones, Sitios y localidades, Catálogo de localidades, Sitios y Nombre-mapa.
Bibliográficos
En éste módulo se ingresan las publicaciones (libros, memorias, tesis, etc.) y subpublicaciones (artículos, capítulos, etc.) que podrán relacionarse al ejemplar, al nombre científico, a las relaciones entre nombres (sinonimia, basónimo, etc.), a los catálogos para la nomenclatura y al módulo ecológico. Aquí se especifican los datos de cada cita bibliográfica como: título, volumen, número, año, etc.
Ecológicos
En este módulo usted puede ingresar información del tipo: taxón, área de distribución y tiempo (periodo), es decir, información poblacional. Este módulo está dividido en Catálogo de parámetros asociados a la población que contiene diversos parámetros que podrían capturarse de una población (p. Ej. demografía, conducta, eco morfología, reproducción, aspectos físicos del ambiente, etc.); catálogos de estudio sobre... donde es posible clasificar al organismo asociado al estudio (organismo vivo modificado, silvestre, etc.); catálogo de investigadores donde es posible ingresar los nombres de los especialistas que llevan a cabo el estudio y poblaciones por taxón donde es posible ingresar datos de una población, ya sea para toda el área de distribución, o para regiones definidas dentro del área de distribución de la población (‘plots’), estos datos pueden ser registrados para todo el periodo del estudio o para una fecha especifica
Directorio
En éste módulo es posible ingresar la información referente a las instituciones y colecciones como es el nombre, siglas, dirección, etc., así como el ingreso al sistema de grupos de determinadores y grupos de colectores u observadores. Este módulo se divide en institución, colección y grupos y personas.