Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...
Corpus de texto 2012
1. Claudia Solórzano Hunter
Introducción
Un corpus es un método empírico en el que se intenta describir las regularidades de los contextos que
conforman las lenguas y así simular los usos reales de ellas. Asimismo, es utilizada como herramienta por
cualquier disciplina lingüística y ha cambiado los enfoques lingüísticos gracias a la complementación de
programas computacionales.
El conjunto de datos está formado por textos sobre la economía. Los cuales se compilarán mediante el
programa Antconc, donde se mostrarán las palabras con mayor frecuencia mediante tablas y figuras.
Antconc
Esta compuesto de herramientas, Concordance, Clusters, Collocates y Wordlist. Dentro de cada herramienta
hay una serie de instrumentos de análisis y de funciones que permiten elaborar listados de palabras
monoléxicas, poliléxicas o polilexemáticas, de agrupamientos léxicos.
Al compilar un corpus se identifican las características de un texto, el idioma y su campo. Antconc, permite
extraer diversos datos en forma de listados de palabras frecuentes, concordancias (listados de palabras clave
contextualizadas, que pueden ordenarse o expandirse según las necesidades del análisis), colocaciones (otras
palabras que aparecen inesperadamente con más frecuencia alrededor de palabras clave) y por último los n-
gramas (listados de secuencias de palabras más frecuentes).
Concordancias
La concordancias permiten observar cualquier ítem aparecido en los listados de palabras frecuentes, tal como
aparece en los textos, con los contextos que le rodean. Se trata del nivel de análisis más detallado, y permite
investigar cada palabra en cada texto. Con ellas es posible identificar clases de palabras, significados, usos,
colocaciones y fraseologismos, patrones gramaticales, usos pragmáticos y características especificas de los
géneros textuales.
2. En la tabla siguiente, podremos ver las concordancias de la palabra ¨crisis¨.
3. Como acabamos de apreciar, las concordancias pueden ayudarnos a obtener diferentes informaciones sobre
las características y comportamientos de una palabra. También existen otras herramientas que pueden
acelerar los procedimientos iniciales de detección de información. Se trata de las colocaciones, una
herramienta de mayor complejidad, la cual ofrece un análisis cuantitativo de las palabras que aparecen en las
proximidades del núcleo o palabra clave.
En la tabla 2. observamos que la palabra crisis se emplea en diferentes contextos a través de
las colocaciones.
4. Ahora que ya tenemos la lista de concordancia, indicamos a Antconc que ordene teniendo en cuenta
n número de palabras a la derecha o a la izquierda del núcleo o palabra base de la concordancia.
Como se observa en este listado, lo primero que aparece ordenado alfabéticamente son las palabras
que ocurren inmediatamente antes de la palabra base.