Indización y lenguaje controlado en Bibliotecología
1. TAREA UNIDAD 1
INDIZACIÓN
Universidad del Quindío
Facultad de Ciencias Humanas y Bellas Artes
Ciencia de la Información y la Documentación, Bibliotecología y Archivística
Febrero 2018
Ladit Osorio Flórez
Ana Milena Acosta Carrascal
Claudia Cárdenas Rodríguez
Jonnathan Cárdenas Rodríguez
LENGUAJES, ANÁLISISY RECUPERACIÓN DE LA
INFORMACIÓN Grupo 01
2. En este proyecto se expone conceptos, características y procesos del análisis
documental enfocándose en la indización y la clasificación con el fin de entrar en
el tema de la organización de información y adquirir bases fundamentales para el
profesional de ciencia de la información.
Se desarrolla con el fin de apropiar conocimientos claves para la evolución y el
progreso del estudiante de CIDBA utilizando herramientas de estudio como son el
resumen y los cuadros sinópticos, fundamentales para enfatizar conceptos y
plantear un orden en el aprendizaje, de esta manera se manifiesta un profundo
análisis del tema abarcando elementos del análisis documental y su correcta
utilización para el proceso laboral.
3. El análisis documental es una operación intelectual por la cual se extrae información con el fin de
interpretarla y representarla por medio de palabras o símbolos para facilitar su acceso o consulta, se
describe su contenido físico (autor, titulo, editorial, etc.) y conceptual por medio de lenguajes de
indización; palabras clave o descriptores de tesauros. Estos métodos de análisis son numerosos y varían
según factores como su profundidad de análisis la cual depende de: tipo de usuarios y necesidad, tipo de
servicios de la unidad de información, tipo de documentos, bases de datos y sistemas de recuperación y
finalidad del análisis.
Para esto se utiliza un lenguaje documental o lenguaje controlado como lo llaman muchos especialistas,
estos son un sistemas de signos que permite representar el contenido de los documentos, estos
lenguajes presentan dos problemas fundamentales para la recuperación de documentos, el ruido
(exceso de información) y silencio (ausencia de información), pero tiene ausencia de los problemas del
lenguaje natural como son normalización de singulares y plurales, ambigüedad y falta de especificidad,
sinonimias y homonimias o polisemias.
Por esto, los lenguajes y vocabularios controlados presentan una evolución a través del tiempo, desde las
clasificaciones universales (CDU, LC, UNESCO) que impedían múltiples aspectos de una investigación y
adoptar temas muy específicos o novedosos, las clasificaciones especializadas elaboradas para sistemas
específicos y no universales que tienen una utilidad complementaria con los descriptores, los
encabezamientos de materia que son acostumbrados para bibliotecas y presentan unas reglas muy
complejas al igual que inconvenientes para una recuperación eficaz, los tesauros que son el vocabulario
más eficaz para el análisis y recuperación ya que presentan especificad y posibilidades combinatorias, y
las listas de autoridades o de identificadores que son vocabularios alfabéticos independientes que
normalizan términos como nombres de personas e instituciones, entre otros, que no se pueden incluir en
el tesauro.
4. La metodología o fases del proceso de indización empiezan por el proceso de descripción del
documento que conlleva descripción física y análisis formal del documento, donde se realiza el análisis
del contenido por medio de la indización y resumen. Empezando por la indización, donde se identifica y
representa el contenido mediante la extracción de conceptos que representan el tema tratado en el
documento por medio de lectura, abstracción, análisis y síntesis teniendo en cuenta el mensaje del
documento, la forma o como se representa la información, la estructura interna o el sistema de relaciones
semánticas y las aportaciones del documento respecto al corpus científico general, a esto se le suma el
convertir el texto original en documento secundario, continua con la selección de términos de indización
donde depende la exhaustividad versus generalidad o materia contra tema y los campos semánticos
donde vemos sobre lo que trata el documento, protagonistas, época, lugar, el tratamiento de la
información y el tipo de estudio que se realiza, los términos principales de la indización pueden ser
objetos contables, procesos, acciones, conceptos, colectivos, documentos, personajes, cronológicos y
topónimos.
Ahora bien, las características y normas de la indización tienen factores fundamentales que contribuyen
a una indización apropiada; especificad donde priorizamos el nivel de precisión de los descriptores en
relación al tema del documento, la exhaustividad donde implica un alto número de descriptores que
faciliten la recuperación, aunque en ocasiones representa un problema con la pertinencia del documento
hallado, la pertinencia donde el descriptor debe ser apto con respecto al texto original, debe ser preciso
y fiel para una recuperación efectiva, y la coherencia donde el subjetivismo debe ser acorde entre
indizadores y la persona que lo esta indizando.
5. Los factores que perjudican la calidad de la indización dependen de características específicas, primero
de las características del indizador, donde entra en juego el conocimiento de la materia, la forma de
búsqueda, las necesidades de usuarios y la capacidad de lectura comprensiva, análisis y síntesis,
segundo, de las características del documento; complejidad, claridad, estructura, presentación y la
existencia de elementos que pueden informar como el título, capítulos o epígrafes y el resumen, y
tercero, las características del proceso de análisis, como los son la selección de descriptores (generales
o específicos, número y cuales), el grado de pre-coordinación de los términos (unitérminos que sean
claros y precisos o términos compuestos por la necesidad de desambigüedad o especificidad
[sustantivo + adjetivo, sustantivo + sintagma, sintagma aposicional]), los campos de indización de la base
de datos como por ejemplo; descriptores, identificadores, topónimos, legislación y periodo histórico.
En segunda instancia con la metodología o fases del proceso de indización es el resumen, donde se
elaboran por medio del análisis formal y el de contenido, sirven como elementos de recuperación y se
pueden seleccionar en coordinación con los descriptores o como elementos nuevos, sea cual sea el caso
se pueden utilizar listas de términos normalizados para nombres propios, siglas, entre otros.
En síntesis, la indización es un proceso que se debe hacer adoptando unas fases o elementos a tener en
cuenta para que el análisis de información se realice exitosamente todo para realizar un proceso
descriptivo con el fin de expresar e interpretar la información para que esta sea recuperable por los
usuarios que lo necesitan.
6.
7. La Bibliotecología en el cumplimiento de sus funciones ha realizado un análisis desde el punto de vista
terminológico del concepto de tesauro y su relación con la clasificación e indización.
En el lenguaje bibliotecológico se ha liberado una polémica con relación a los diferentes conceptos de
tesauros, observándose una carencia del término clasificación temática en la disciplina bibliotecológica.
Morales (2001:224) afirma lo siguiente “Considerando que un tesauro no representa un instrumento de
clasificación temática, sino una herramienta de control para la indización y recuperación de la
información almacenada, JURIVOX plantea una sistematización conceptual que se afianza en la realidad
del derecho positivo actual”. Según la idea de Morales se consideran los siguientes pensamientos: 1) el
tesauro no es una clasificación temática; 2) el tesauro es una herramienta de control para la indización y
la recuperación de la información; 3) un tesauro plantea una sistematización conceptual que se afianza
en el conocimiento de una disciplina.
Es así como distintos autores como Naumis (2000:104) exponen sus conceptos del término tesauro
El lenguaje de la bibliotecología
El lenguaje científico y tecnológico es más preciso que el lenguaje natural, enfocado desde la propia
Bibliotecología.
Según el comité ISO/TC37 (Pozzi 1999:16) se establece al concepto como una unidad de conocimiento
creada por una combinación única de características.
Los especifico y claro de los términos bibliotecológicos se ira obteniendo a través de su especialización,
adicionándoles una consistencia de significado relacionada con la propia disciplina y contenido
semántico único, con respecto al lenguaje natural.
8. Indización en Bibliotecología
En el lenguaje natural INDIZACIÖN es: el registro ordenado de datos e información para elaborar un
índice (según el Diccionario de la Lengua Española). En el diccionario especializado de Martínez de
Sousa se incluyen tres acepciones: 1) acción y efecto de indizar; 2) confección de índices; 3) extracción
de conceptos del texto de un documento para expresarlos con la ayuda de un lenguaje, como palabras
claves, descriptores o índices de una clasificación. Esta última es la connotación otorgada en el campo
de la Bibliotecología, que también se designa como indización temática.
Langridge (1992:63) lo explica de tres modos distintos: 1) sinónimo de organización del conocimiento en
las biblioteca e incluye tanto el índice de autor, titulo, descripción del documento y todos los temas
tratados en el documento; 2) acto de registro del contenido de una colección; 3) el índice alfabético para
el contenido de libros arreglados temáticamente o el índice alfabético a un catálogo arreglado
sistemáticamente
Vizcaya Alonso (1997:152)“se puede considerar por tanto, la indización como un proceso de descripción
más exhaustivo y profundo que el proceso de clasificación.
Cleveland & Cleveland (1990:17) define un índice como una lista de información bibliográfica o citas
hacia un cuerpo literario, usualmente arreglados en orden alfabético y basados en algunos datos
específicos, tales como autor, tema o palabras claves.
En la tarea de indizar por temas se distingue la indización humana y la automática, la primera trabaja
en base a los conceptos tratados en un documento y la segunda en base a los términos que aparecen
mencionados; en medio de estos dos tipos de indización existen clasificaciones intermedias, como la
asignación humana de palabras significativas en los textos y la segunda incluye no solo la temática sin
intervención humana, sino además la organización de los índices de datos que contiene cada uno de los
registros bibliográficos del sistema o palabras significativas del texto completo de los documentos.
9. La clasificación temática como un sistema de organización del conocimiento
En la literatura bibliotecológica la clasificación está ligada a la descripción de contenido como forma de
agrupación del conocimiento de acuerdo a la temática implícita en cada uno de los documentos que
integran un sistema de información.
Según Chan (citado por Gil Urdicianin 1981:209) -es el acto de organizar el universo del conocimiento en
algún orden sistemático.
Cleveland & Cleveland (1190:17) agrega literalmente que “en efecto, la indización es un acto de la
clasificación”.
En la indización temática ahora también se accede a los documentos digitales que los contienen de
forma bastante inmediata y cada vez es mayor la rapidez de obtención de cualquier documento en
cualquier documento en cualquier parte del mundo; lo cierto es que tanto los esquemas de clasificación
bibliográfica, como los tesauros están basados en una estructura del conocimiento y los dos por lo tanto
deben ser considerados sistemas de clasificación.
Tesauro documental como clasificación temática
“Existe una gran variedad de opiniones sobre los antecedentes, tanto etimológicos como conceptuales,
del tesauro. La mayoría de los autores se limitan a dar cuenta de su raíz semántica griega, como tesoro,
bien material del conocimiento.”(Rubio, 1999:57).En la actualidad, la voz de tesauro se usa para designar
el instrumento de indización en el ámbito de la Bibliotecología y la Documentación, aunque aparece en
algunos diccionarios y enciclopedias usadas en el sentido de diccionario, catálogo o antología y algunos
diccionarios sobre todo etimológicos también utilizan esta designación. En la Bibliotecología y la
Documentación se puede utilizar un término que lo califique y distinga, como tesauro documental.
Consideraciones finales
La Bibliotecología como disciplina necesita asignar significados precisos a sus términos. El definir
procesos e ideas involucradas en la clasificación y la indización y relacionarlos con su expresión
lingüística es conciliar diferentes caminos para referirse a técnicas, conceptos y principios similares.
10.
11. En la visita realizada la Bibliotecóloga de comfenalco encargada del proceso de indización en la
Biblioteca, explicó como se realiza el proceso de esta labor en este lugar, iniciando con la aclaración del
concepto de indización.
12. Indización es el primer proceso que se realiza antes de iniciar con la
catalogación y en este proceso se determina las palabras claves para la
recuperación de un material bibliográfico, una vez se busca el material
bibliográfico se determinar a que área del conocimiento pertenece al
igual que determinar los temas que se desarrollan en el libro.
y con relación a los temas se empiezan a buscar en la lista LEMB para
precisar la terminología y como se deben escribir.
Utilizan una lista de encabezamiento de materia llamadas LEMB. Estas
listan se encuentran organizadas alfabéticamente, controlan los
términos y nombres para que halla una búsqueda universal
13. ▪ A la hora de indizar tienen en cuenta la nacionalidad del autor
y la temática
▪ Índice de acuerdo con su tipo de entrada utilizan los tres Autor,
Materia,Titulo.
▪ Índice de acuerdo con su forma de presentación lo realizan en
medios magnéticos.
▪ El Software que la biblioteca utiliza para la indización es el
Koha.
La biblioteca utiliza el MESH para los encabezados de
temas médicos, tiene un amplio vocabulario terminológico
en temas de medicina.
14. En esta actividad colaborativa se adquirieron bases teóricas sobre
conocimientos del análisis documental y la gestión de la organización de la
información, así como su proceso evolutivo y sus conceptos claves, constatando
que la disciplina de bibliotecología necesita fijar significados precisos a la
información procesada con el fin de brindar la información pertinente según la
necesidad del solicitante, esto tras un proceso largo de análisis y gestión como lo
es la indización; su metodología, análisis, descripción y normas pertinentes para
su correcto y fácil uso.
15. Cuadro Sinóptico. (2018). Recuperado de: https://www.cuadrosinoptico.com/
Cruz., M. (2018). El Análisis Documental: Indización y Resumen en Bases de
Datos Especializadas.
Recuperado de: http://eprints.rclis.org/6015/
Peña,N,C.(2003). Indización y clasificación: Un problema conceptual y
terminológico. Recuperado de:
https://cidba.uniquindio.edu.co/pluginfile.php/14008/mod_resource/conten
t/1/Lectura%201.Indizaci%C3%B3n%20y%20clasificaci%C3%B3n.PDF
Universidad del Quindío. (2018).Lenguajes, análisis y recuperación de la
información. Recuperado de:
https://cidba.uniquindio.edu.co/pluginfile.php/9064/mod_label/intro/Unida
d%201_Indizaci%C3%B3n%20%281%29.pdf
Wikipedia. (2018). Medical Subect Headings. Recuperado de:
https://es.wikipedia.org/wiki/Medical_Subject_Headings