2. CONCEPTO
Es un campo interdisciplinario entre el modelado basado en reglas y el modelado estadístico del lenguaje
desde una perspectiva computacional. Dicho modelado no se centra en ninguna de las áreas de la lingüística
particular, sino que es un campo interdisciplinar, en el que participan lingüistas e informáticos especializados
inteligencia artificial, psicólogos cognoscitivos y expertos en lógica, entre otros.
Algunas de las áreas de estudio son:
• Corpus lingüístico asistido por ordenador.
• Diseño de analizadores sintácticos (en inglés: parser), para lenguajes naturales.
• Diseño de etiquetadores o lematizadores.
• Definición de lógicas especializadas que sirvan como fuente para el Procesamiento de Lenguajes Naturales.
• Estudio de la posible relación entre lenguajes formales y naturales.
3. ORIGEN
La lingüística computacional surgió en los EE. UU. en los años 1950 como un esfuerzo para obtener
computadoras capaces de traducir textos automáticamente de lenguas extranjeras al inglés,
particularmente de revistas científicas rusas. Surgió como resultado de las aseveraciones de Warren
Weaver, quien veía en la traducción una forma de descifrado. Cuando la inteligencia artificial apareció
la década de los sesenta, la lingüística computacional se convirtió en una rama de la IA, tratando con
nivel de comprensión humano y la producción de los lenguajes naturales.
Para traducir un lenguaje en otro, se observó que uno tenía que entender la sintaxis de ambos
al menos en el nivel de morfología (la sintaxis de las palabras) y las frases enteras. Para entender la
sintaxis, uno debe entender la semántica del vocabulario y la pragmática del lenguaje. Lo que empezó
como un esfuerzo para traducir textos se convirtió en una disciplina encargada de entender cómo
representar y procesar el lenguaje natural individual usando ordenadores.
Este tipo de estudios se conocen también como lingüística de corpus, ya que la denominación
"computacional" puede prestarse a confusión.
4. RAMAS DE ESTUDIO
La lingüística computacional se ha dividido en dos ramas:
Lingüística computacional teórica
Basa sus temas de trabajo en la lingüística teórica y en la ciencia cognitiva. Los aportes de la psicología
cognitiva, en especial de la psicolingüística, también son de especial relevancia, y han dado como
resultado la aparición de una nueva ciencia, la psicolingüística computacional.
Lingüística computacional aplicada. Es una vertiente de la lingüística computacional con una
evidente orientación tecnológica, lo que ha provocado que con frecuencia sea referida con
como ingeniería lingüística o tecnología del lenguaje humano. Se centra en los aspectos prácticos
se puedan derivar de la simulación de la conducta lingüística con medios informáticos.
Su objetivo es crear productos informáticos que incorporen algún componente en el que intervenga el
lenguaje, oral o escrito
5. Entre ellos figuran:
El apoyo a los usuarios de computadores con el procesamiento de texto, por ejemplo, corrección de errores
digitación y ortográficos, prueba de la corrección gramatical, cambio en ideogramas en japonés o chino.
La búsqueda automática en pasajes de texto (búsqueda inteligente de información) y, no solo su forma,
también su significado (recuperación de información y motores de búsqueda).
El apoyo al traducir textos en otra lengua (traducción asistida por ordenador) o también la traducción
automática.
El procesamiento del lenguaje hablado (reconocimiento del habla y síntesis de habla), por ejemplo, en el
servicio de información telefónico o en aparatos de lectura para ciegos.
De la búsqueda de información en grande de bibliografías a la contestación directa de preguntas sobre la
de grandes bancos de datos (recuperación de información, minería de datos, extracción de la información).
El tratamiento de datos presentes lingüísticamente, por ejemplo, la indexación de literatura, la creación de
índices y listas de materias, la producción de resúmenes y abstracts.
El apoyo a los autores en la redacción de textos, por ejemplo, en la búsqueda de la palabra precisa o la
terminología correcta.
La interacción de los usuarios con el computador en lenguaje natural, tal que los computadores sean
accesibles también a las personas que no tienen suficiente conocimiento de las órdenes específicas
hombre-máquina).
6. PROBLEMAS DE LA LINGÜÍSTICA COMPUTACIONAL
Algunos de los problemas que se deben resolver son:
Determinar la semántica. La misma forma de palabra puede presentar en función del contexto un
significado diferente (comparar homónimo). Se debe elegir el significado pertinente al contexto. Por
lado, se necesitan formalismos para la representación de los significados de las palabras.
Resolución de la ambigüedad sintáctica. En algunos casos, una frase se deja analizar e interpretar de
formas. Elegir la correcta exige algunas veces información semántica sobre el acto de habla y la
del hablante, pero, al menos, conocimientos estadísticos previos sobre la co-ocurrencia (aparición
conjunta) de las palabras.
7. APLICACIONES DE LA PSICOLINGUISTICA COMPUTACIONAL
• Analizador sintáctico
• Analizador morfológico
• Analizador semántico
• Alineador
• Conjugador
• Conversor de lenguajes
• Corpus lingüístico
• Corrector ortográfico
• Desambiguador funcional
• Flexionador
• Lematizador
• Motor de indexación = Motor de indización