SlideShare ist ein Scribd-Unternehmen logo
1 von 12
Lingüística de Corpus
Julio Bernal
Alejandro Correa
Carlos Rodríguez
Daniel Moreno
Ruth Rubio
Diana Hincapié
Instituto Caro y Cuervo
Febrero de 2014
Presentación
• La lingüística de Corpus se encarga de analizar y
sistematizar conjuntos extensos y ordenados de datos
de una lengua producidos de manera oral, escrita, y
audiovisual. Estos datos son almacenados de forma
electrónica y sistematizados desde criterios lingüísticos,
literarios, culturales y sociales con el fin de que puedan
servir como base de investigaciones desde diferentes
ciencias o disciplinas.
Presentación
●
● La lingüística computacional se encarga del estudio,
diseño y elaboración de modelos computacionales
capaces de simular las habilidades lingüísticas del ser
humano. Se relaciona con el uso de herramientas
informáticas tanto para realizar diversas tareas en
lenguas naturales como para el manejo,
procesamiento, análisis y búsqueda de datos en
investigación.
Justificación
La aplicación de procedimientos computacionales
en la investigación lingüística se ha convertido en un
requisito para procesar señales, cuantificar datos y
verificar hipótesis en las diferentes disciplinas i.e.
fonética, lexicografía, morfosintaxis, sociolingüística,
psicolingüística, etc.
Esta tendencia se debe al éxito del razonamiento
inductivo, al análisis de grandes corpus y al
desarrollo de software especializado de libre uso.
Objetivo General
Seleccionar, organizar y almacenar en forma
electrónica corpus de diferentes fuentes y registros
(oral, escrito y audiovisual), a partir de bases de datos
de las lenguas de Colombia, desde criterios
lingüísticos, literarios, culturales y sociales.
Objetivos Específicos
● Elaborar manuales que describan el uso de programas
necesarios para procesar, transcribir, etiquetar, cuantificar
y analizar datos lingüísticos.
● Escribir un libro con los estados del arte de la Lingüística de
Corpus y la Lingüística Computacional.
● Escribir un libro sobre diccionarios electrónicos
especializados, basados en la experiencia del DIACME
(Diccionario Académico de Medicina).
● Escribir protocolos que orienten la elección, el uso y la
proyección de herramientas computacionales para
elaboración de corpus y la descripción y análisis de
material lingüístico.
Objetivos Específicos
● Elaborar recursos para el uso de herramientas
computacionales y el trabajo con corpus, sistematizados en
la web.
● Generar y fortalecer redes académicas en torno a la
Lingüística de corpus.
● Realizar la rehabilitación y modernización del laboratorio
de fonética del Instituto Caro y Cuervo.
● Escribir manuales (texto y video) en los que se describa el
uso pormenorizado de software para la investigación
lingüística.
Estrategia Académica Transversal
El grupo de investigación de lingüística de corpus del
Instituto Caro y Cuervo plantea un proyecto académico
actual y transversal, en la medida en que diferentes
investigaciones del ICC requieren de sistemas de
recolección, almacenamiento, sistematización,
descripción y/o análisis de diferentes bases de datos del
español de Colombia.
Lingüística de Corpus
Lingüística de Corpus
Productos
Productos

Weitere ähnliche Inhalte

Ähnlich wie Presentación lingüística de corpus 2014

Presentar plan
Presentar planPresentar plan
Presentar plan
Adolfo
 
Presentacion l-materna-1(1)
Presentacion l-materna-1(1)Presentacion l-materna-1(1)
Presentacion l-materna-1(1)
Ustadistancia
 
Escuela normal experimental de el fuerte
Escuela normal experimental de el fuerteEscuela normal experimental de el fuerte
Escuela normal experimental de el fuerte
Diego Robles F
 
Actividad_2.docx trabajode linguistica en basica primaria para maestria
Actividad_2.docx trabajode linguistica en basica primaria para maestriaActividad_2.docx trabajode linguistica en basica primaria para maestria
Actividad_2.docx trabajode linguistica en basica primaria para maestria
AngelicSuarezRuiz
 

Ähnlich wie Presentación lingüística de corpus 2014 (20)

Lengua 1 bgu
Lengua 1 bguLengua 1 bgu
Lengua 1 bgu
 
Lengua 1 bgu
Lengua 1 bguLengua 1 bgu
Lengua 1 bgu
 
Lengua 2 bgu_2
Lengua 2 bgu_2Lengua 2 bgu_2
Lengua 2 bgu_2
 
Lengua 2 bgu
Lengua 2 bguLengua 2 bgu
Lengua 2 bgu
 
18-1-24-PROGRAMACIÓN ANALITICA DE ESPAÑOL.docx
18-1-24-PROGRAMACIÓN ANALITICA DE ESPAÑOL.docx18-1-24-PROGRAMACIÓN ANALITICA DE ESPAÑOL.docx
18-1-24-PROGRAMACIÓN ANALITICA DE ESPAÑOL.docx
 
Presentar plan
Presentar planPresentar plan
Presentar plan
 
Corpus del Quechua
Corpus del QuechuaCorpus del Quechua
Corpus del Quechua
 
Lengua 1 bgu
Lengua 1 bguLengua 1 bgu
Lengua 1 bgu
 
Lengua 1 bgu
Lengua 1 bguLengua 1 bgu
Lengua 1 bgu
 
Lengua 1 bgu
Lengua 1 bguLengua 1 bgu
Lengua 1 bgu
 
Lengua 1 bgu
Lengua 1 bguLengua 1 bgu
Lengua 1 bgu
 
Pca
PcaPca
Pca
 
Presentacion l-materna-1(1)
Presentacion l-materna-1(1)Presentacion l-materna-1(1)
Presentacion l-materna-1(1)
 
Planificacion curricular del curso
Planificacion curricular del cursoPlanificacion curricular del curso
Planificacion curricular del curso
 
PROYECTO LINGÜÍSTICO DE CENTRO: pautas de diseño y explotación - cep córdoba-...
PROYECTO LINGÜÍSTICO DE CENTRO: pautas de diseño y explotación - cep córdoba-...PROYECTO LINGÜÍSTICO DE CENTRO: pautas de diseño y explotación - cep córdoba-...
PROYECTO LINGÜÍSTICO DE CENTRO: pautas de diseño y explotación - cep córdoba-...
 
GUÍA PRACTICA GRUPO 20.docx
GUÍA PRACTICA GRUPO 20.docxGUÍA PRACTICA GRUPO 20.docx
GUÍA PRACTICA GRUPO 20.docx
 
Escuela normal experimental de el fuerte
Escuela normal experimental de el fuerteEscuela normal experimental de el fuerte
Escuela normal experimental de el fuerte
 
Guia articuladora 5 2013 - 2014
Guia articuladora 5 2013 - 2014Guia articuladora 5 2013 - 2014
Guia articuladora 5 2013 - 2014
 
Plan curricular-anual 1 erobgu
Plan curricular-anual 1 erobguPlan curricular-anual 1 erobgu
Plan curricular-anual 1 erobgu
 
Actividad_2.docx trabajode linguistica en basica primaria para maestria
Actividad_2.docx trabajode linguistica en basica primaria para maestriaActividad_2.docx trabajode linguistica en basica primaria para maestria
Actividad_2.docx trabajode linguistica en basica primaria para maestria
 

Kürzlich hochgeladen

🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
EliaHernndez7
 
RESOLUCIÓN VICEMINISTERIAL 00048 - 2024 EVALUACION
RESOLUCIÓN VICEMINISTERIAL 00048 - 2024 EVALUACIONRESOLUCIÓN VICEMINISTERIAL 00048 - 2024 EVALUACION
RESOLUCIÓN VICEMINISTERIAL 00048 - 2024 EVALUACION
amelia poma
 
PROPUESTA COMERCIAL SENA ETAPA 2 ACTIVIDAD 3.pdf
PROPUESTA COMERCIAL SENA ETAPA 2 ACTIVIDAD 3.pdfPROPUESTA COMERCIAL SENA ETAPA 2 ACTIVIDAD 3.pdf
PROPUESTA COMERCIAL SENA ETAPA 2 ACTIVIDAD 3.pdf
EduardoJosVargasCama1
 
Concepto y definición de tipos de Datos Abstractos en c++.pptx
Concepto y definición de tipos de Datos Abstractos en c++.pptxConcepto y definición de tipos de Datos Abstractos en c++.pptx
Concepto y definición de tipos de Datos Abstractos en c++.pptx
Fernando Solis
 

Kürzlich hochgeladen (20)

Prueba libre de Geografía para obtención título Bachillerato - 2024
Prueba libre de Geografía para obtención título Bachillerato - 2024Prueba libre de Geografía para obtención título Bachillerato - 2024
Prueba libre de Geografía para obtención título Bachillerato - 2024
 
Power Point E. S.: Los dos testigos.pptx
Power Point E. S.: Los dos testigos.pptxPower Point E. S.: Los dos testigos.pptx
Power Point E. S.: Los dos testigos.pptx
 
Factores que intervienen en la Administración por Valores.pdf
Factores que intervienen en la Administración por Valores.pdfFactores que intervienen en la Administración por Valores.pdf
Factores que intervienen en la Administración por Valores.pdf
 
La Sostenibilidad Corporativa. Administración Ambiental
La Sostenibilidad Corporativa. Administración AmbientalLa Sostenibilidad Corporativa. Administración Ambiental
La Sostenibilidad Corporativa. Administración Ambiental
 
Feliz Día de la Madre - 5 de Mayo, 2024.pdf
Feliz Día de la Madre - 5 de Mayo, 2024.pdfFeliz Día de la Madre - 5 de Mayo, 2024.pdf
Feliz Día de la Madre - 5 de Mayo, 2024.pdf
 
🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
 
Interpretación de cortes geológicos 2024
Interpretación de cortes geológicos 2024Interpretación de cortes geológicos 2024
Interpretación de cortes geológicos 2024
 
Los dos testigos. Testifican de la Verdad
Los dos testigos. Testifican de la VerdadLos dos testigos. Testifican de la Verdad
Los dos testigos. Testifican de la Verdad
 
RESOLUCIÓN VICEMINISTERIAL 00048 - 2024 EVALUACION
RESOLUCIÓN VICEMINISTERIAL 00048 - 2024 EVALUACIONRESOLUCIÓN VICEMINISTERIAL 00048 - 2024 EVALUACION
RESOLUCIÓN VICEMINISTERIAL 00048 - 2024 EVALUACION
 
FICHA PROYECTO COIL- GLOBAL CLASSROOM.docx.pdf
FICHA PROYECTO COIL- GLOBAL CLASSROOM.docx.pdfFICHA PROYECTO COIL- GLOBAL CLASSROOM.docx.pdf
FICHA PROYECTO COIL- GLOBAL CLASSROOM.docx.pdf
 
Tema 10. Dinámica y funciones de la Atmosfera 2024
Tema 10. Dinámica y funciones de la Atmosfera 2024Tema 10. Dinámica y funciones de la Atmosfera 2024
Tema 10. Dinámica y funciones de la Atmosfera 2024
 
SISTEMA RESPIRATORIO PARA NIÑOS PRIMARIA
SISTEMA RESPIRATORIO PARA NIÑOS PRIMARIASISTEMA RESPIRATORIO PARA NIÑOS PRIMARIA
SISTEMA RESPIRATORIO PARA NIÑOS PRIMARIA
 
PROPUESTA COMERCIAL SENA ETAPA 2 ACTIVIDAD 3.pdf
PROPUESTA COMERCIAL SENA ETAPA 2 ACTIVIDAD 3.pdfPROPUESTA COMERCIAL SENA ETAPA 2 ACTIVIDAD 3.pdf
PROPUESTA COMERCIAL SENA ETAPA 2 ACTIVIDAD 3.pdf
 
PLAN LECTOR 2024 integrado nivel inicial-miercoles 10.pptx
PLAN LECTOR 2024  integrado nivel inicial-miercoles 10.pptxPLAN LECTOR 2024  integrado nivel inicial-miercoles 10.pptx
PLAN LECTOR 2024 integrado nivel inicial-miercoles 10.pptx
 
PINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).ppt
PINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).pptPINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).ppt
PINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).ppt
 
Actividades para el 11 de Mayo día del himno.docx
Actividades para el 11 de Mayo día del himno.docxActividades para el 11 de Mayo día del himno.docx
Actividades para el 11 de Mayo día del himno.docx
 
PLAN DE REFUERZO ESCOLAR MERC 2024-2.docx
PLAN DE REFUERZO ESCOLAR MERC 2024-2.docxPLAN DE REFUERZO ESCOLAR MERC 2024-2.docx
PLAN DE REFUERZO ESCOLAR MERC 2024-2.docx
 
Supuestos_prácticos_funciones.docx
Supuestos_prácticos_funciones.docxSupuestos_prácticos_funciones.docx
Supuestos_prácticos_funciones.docx
 
Concepto y definición de tipos de Datos Abstractos en c++.pptx
Concepto y definición de tipos de Datos Abstractos en c++.pptxConcepto y definición de tipos de Datos Abstractos en c++.pptx
Concepto y definición de tipos de Datos Abstractos en c++.pptx
 
Código Civil de la República Bolivariana de Venezuela
Código Civil de la República Bolivariana de VenezuelaCódigo Civil de la República Bolivariana de Venezuela
Código Civil de la República Bolivariana de Venezuela
 

Presentación lingüística de corpus 2014

  • 1. Lingüística de Corpus Julio Bernal Alejandro Correa Carlos Rodríguez Daniel Moreno Ruth Rubio Diana Hincapié Instituto Caro y Cuervo Febrero de 2014
  • 2. Presentación • La lingüística de Corpus se encarga de analizar y sistematizar conjuntos extensos y ordenados de datos de una lengua producidos de manera oral, escrita, y audiovisual. Estos datos son almacenados de forma electrónica y sistematizados desde criterios lingüísticos, literarios, culturales y sociales con el fin de que puedan servir como base de investigaciones desde diferentes ciencias o disciplinas.
  • 3. Presentación ● ● La lingüística computacional se encarga del estudio, diseño y elaboración de modelos computacionales capaces de simular las habilidades lingüísticas del ser humano. Se relaciona con el uso de herramientas informáticas tanto para realizar diversas tareas en lenguas naturales como para el manejo, procesamiento, análisis y búsqueda de datos en investigación.
  • 4. Justificación La aplicación de procedimientos computacionales en la investigación lingüística se ha convertido en un requisito para procesar señales, cuantificar datos y verificar hipótesis en las diferentes disciplinas i.e. fonética, lexicografía, morfosintaxis, sociolingüística, psicolingüística, etc. Esta tendencia se debe al éxito del razonamiento inductivo, al análisis de grandes corpus y al desarrollo de software especializado de libre uso.
  • 5. Objetivo General Seleccionar, organizar y almacenar en forma electrónica corpus de diferentes fuentes y registros (oral, escrito y audiovisual), a partir de bases de datos de las lenguas de Colombia, desde criterios lingüísticos, literarios, culturales y sociales.
  • 6. Objetivos Específicos ● Elaborar manuales que describan el uso de programas necesarios para procesar, transcribir, etiquetar, cuantificar y analizar datos lingüísticos. ● Escribir un libro con los estados del arte de la Lingüística de Corpus y la Lingüística Computacional. ● Escribir un libro sobre diccionarios electrónicos especializados, basados en la experiencia del DIACME (Diccionario Académico de Medicina). ● Escribir protocolos que orienten la elección, el uso y la proyección de herramientas computacionales para elaboración de corpus y la descripción y análisis de material lingüístico.
  • 7. Objetivos Específicos ● Elaborar recursos para el uso de herramientas computacionales y el trabajo con corpus, sistematizados en la web. ● Generar y fortalecer redes académicas en torno a la Lingüística de corpus. ● Realizar la rehabilitación y modernización del laboratorio de fonética del Instituto Caro y Cuervo. ● Escribir manuales (texto y video) en los que se describa el uso pormenorizado de software para la investigación lingüística.
  • 8. Estrategia Académica Transversal El grupo de investigación de lingüística de corpus del Instituto Caro y Cuervo plantea un proyecto académico actual y transversal, en la medida en que diferentes investigaciones del ICC requieren de sistemas de recolección, almacenamiento, sistematización, descripción y/o análisis de diferentes bases de datos del español de Colombia.