1. Diccionarios y corpus electrónicos
como herramientas del traductor
Alicia Moratal Gómez
2. Índice
• Definición de corpus
• Características básicas: el corpus y el
diccionario
• Información que podemos encontrar en cada
una de estas herramientas
• Ejemplos de corpus
• Bibliografía
3. Definición de corpus
• Un corpus lingüístico es un conjunto de textos
almacenados en formato electrónico y
agrupados con el fin de estudiar una lengua o
una determinada variedad lingüística.
4. Diccionarios
• Resaltar la especificidad del diccionario frente al corpus
• Entradas formadas por el lema y el cuerpo del artículo
• De carácter lingüístico, enciclopédico o mixto, según
su tipología
• Número de lenguas (monolingüe, bilingüe…)
5. Corpus
• Se actualiza con más facilidad que el diccionario, pero
exige del usuario un trabajo de comparación y análisis
• Conserva su estado bruto de muestra de lengua con
todo su contexto
• Orales o textuales según su tipología
• (Consta de) Concordancias: de una obra, registran al
menos todas las palabras no gramaticales que la
forman, reproduciendo un contexto mínimo e indicando
el pasaje en que aparecen
6. Comparación: diccionarios y corpus
(qué tipo de información podemos
encontrar en cada uno)
CORPUS:
• Número de ocurrencias totales
de las palabras
• Número de palabras distintas
• Riqueza léxica
• Porcentajes de aparición
• Extracción selectiva de
ejemplos reales
• Datos predefinidos relativos a las
fuentes (autores, fechas, géneros
y subgéneros, países…)
DICCIONARIOS:
• Categoría gramatical
• Estructura sintáctica
• Sentidos básicos (acepciones)
• Aspectos semánticos
(sinónimos, antónimos)
• Aspectos formales (etimología,
derivados, homófonos).
7. Ejemplos
• Corpus de referencia del español actual: CREA
(contiene textos literarios, periodísticos y científicotécnicos, así como transcripciones de grabaciones
de la lengua oral y de medios de comunicación
desde 1975) http://corpus.rae.es/creanet.html
• Corpus diacrónico del español: CORDE (es un
corpus textual de todas las épocas y lugares en que
se habló español, desde los inicios del idioma hasta
el año 1975) http://corpus.rae.es/cordenet.html
8. Otros corpus
• La BDS, Base de Datos Sintácticos del Español Actual,
de la Universidad de Santiago de Compostela (tiene
esquematizadas todas las estructuras sintácticas
regidas por los verbos)
• El CORLEC, Corpus oral de referencia de la lengua
española contemporánea, de la Universidad Autónoma
de Madrid (ofrece de forma libre en la red una muestra
de textos clasificados por temas y medios de
comunicación transcritos de grabaciones orales)
9. Bibliografía
• Sanz, G. (2005). Diccionarios monolingües electrónicos, entre el
diccionario y el corpus. En ROMANA GARCÍA, María Luisa [ed.] II
AIETI. Actas del II Congreso Internacional de la Asociación Ibérica de
Estudios de Traducción e Interpretación. Madrid, 9-11 de febrero de
2005. Madrid: AIETI, pp. 382-392. ISBN 84-8468-151-3.
http://www.aieti.eu/pubs/actas/II/AIETI_2_GSE_Diccionarios.pdf
• Martín, R. A. (2013). Práctica de los diccionarios y corpus
electrónicos en la enseñanza de la lengua española. Didáctica,
Innovación y Multimedia (Revista DIM), (26), 1-11.
http://www.raco.cat/index.php/DIM/article/viewFile/269848/357376
• http://lorien.die.upm.es/juancho/pfcs/AJP/cap4.pdf