0
Creación de corpus oral y escrito en la lengua quechua (Qhishwa simita chaninchasun)
1. Objetivos <ul><li>Elaborar un corpus digital escrito del quechua con 50 millones de palabras considerando su representa...
2. Descripción del proyecto <ul><li>El proyecto se desarrollará durante dos años, que comprenderá la recolección, el proce...
Dialectos del quechua Q- I Q-II QHISHWA  CORPORA
3. Metodología: Uso de Recursos / Costes 02 años Concepción Recopilación textos escritos y orales Marcado, etiquetaje,  Re...
4. ACTIVIDADES: Tareas y subtareas <ul><ul><li>Planificación y organización de actividades </li></ul></ul><ul><ul><li>Asig...
<ul><li>TEXTOS ESCRITOS: </li></ul><ul><ul><li>Localización de los textos, según zonas geográficas y países. </li></ul></u...
<ul><ul><li>Marcaje estructural y etiquetaje </li></ul></ul><ul><ul><li>Preproceso (detección de fechas, números, locucion...
Recursos del Proyecto Humanos Informática y  software Equipos Materiales Finacieros Oficina/ centro  de procesamiento
RECURSOS HUMANOS: Coordinador del Proyecto - Responsabilidades <ul><ul><li>Integrar  los esfuerzos de los miembros del equ...
Equipo de Proyecto <ul><li>Grupo de personas lideradas por el Coordinador del proyecto. </li></ul><ul><li>Representan área...
Corpus oral y escrito del quechua CORPORA QHICHWA  Registrarse Adolfo Zárate Pérez-pa ruwasqan
Nächste SlideShare
Wird geladen in ...5
×

Corpus del Quechua

584

Published on

Qhishwa simi yuyanchanapaq

Published in: Bildung
0 Kommentare
0 Gefällt mir
Statistiken
Notizen
  • Hinterlassen Sie den ersten Kommentar

  • Be the first to like this

Keine Downloads
Views
Gesamtviews
584
Bei Slideshare
0
Aus Einbettungen
0
Anzahl an Einbettungen
0
Aktionen
Geteilt
0
Downloads
1
Kommentare
0
Gefällt mir
0
Einbettungen 0
No embeds

No notes for slide

Transcript of "Corpus del Quechua"

  1. 1. Creación de corpus oral y escrito en la lengua quechua (Qhishwa simita chaninchasun)
  2. 2. 1. Objetivos <ul><li>Elaborar un corpus digital escrito del quechua con 50 millones de palabras considerando su representatividad y equilibrio. </li></ul><ul><li>Implementar el etiquetado y marcarje gramatical, semántico, sintáctico y pragmático. </li></ul><ul><li>Grabar, transcribir y organizar un corpus oral del quechua teniendo presente las variantes dialectales y los registros. </li></ul><ul><li>Poner a disposición de los investigadores nacionales e internacionales un corpus de referencia del quechua. </li></ul>
  3. 3. 2. Descripción del proyecto <ul><li>El proyecto se desarrollará durante dos años, que comprenderá la recolección, el procesamiento, organización del corpus </li></ul><ul><li>El proyecto está orientado a construir un corpus de referencia digital en quechua con 50 millones de palabra en la lengua escrita y 10 millones de la lengua oral en quechua. Los datos serán tomados del lenguaje natural considerando los dialectos que existen en el quechua, distribuidos de la siguiente manera (Torero, 1974): </li></ul>
  4. 4. Dialectos del quechua Q- I Q-II QHISHWA CORPORA
  5. 5. 3. Metodología: Uso de Recursos / Costes 02 años Concepción Recopilación textos escritos y orales Marcado, etiquetaje, Recursos informáticos. Producto: Corpus tiempo Esfuerzo
  6. 6. 4. ACTIVIDADES: Tareas y subtareas <ul><ul><li>Planificación y organización de actividades </li></ul></ul><ul><ul><li>Asignación de responsabilidades </li></ul></ul><ul><ul><li>Lectura del marco teórico. </li></ul></ul>FASE I Concepción del proyecto
  7. 7. <ul><li>TEXTOS ESCRITOS: </li></ul><ul><ul><li>Localización de los textos, según zonas geográficas y países. </li></ul></ul><ul><ul><li>Recopilar un conjunto de textos de documentos escritos: libros, informes u otros documentos. </li></ul></ul><ul><ul><li>Digitalización de los textos </li></ul></ul><ul><ul><li>Almacenamiento los textos en archivos clasificados según géneros/ temas </li></ul></ul><ul><ul><li>Corrección informática y manual de los textos </li></ul></ul><ul><li>TEXTOS ORALES </li></ul><ul><ul><li>Localización de las zonas geográficas y países </li></ul></ul><ul><ul><li>Grabación en lugares de destino </li></ul></ul><ul><ul><li>Transcripción automática del corpus </li></ul></ul><ul><ul><li>Ficha técnica </li></ul></ul><ul><ul><li>Corrección manual de la transcripción </li></ul></ul>FASE II: Recopilación y organización de textos en contextos naturales.
  8. 8. <ul><ul><li>Marcaje estructural y etiquetaje </li></ul></ul><ul><ul><li>Preproceso (detección de fechas, números, locuciones, nombres propios...)  </li></ul></ul><ul><ul><li>Análisis y marcaje morfológicos de acuerdo con los etiquetarios morfológicos </li></ul></ul><ul><ul><li>Desambiguación lingüística y/o estadística </li></ul></ul><ul><ul><li>Las inferencias (analizadores automáticos), </li></ul></ul><ul><ul><li>Las anotaciones (actos de habla: información, opinión, aliento, etc.) </li></ul></ul><ul><ul><li>Las colocaciones (para Baker resulta útil porque ayuda a resumir las relaciones más importantes entre las palabras), </li></ul></ul><ul><ul><li>Los análisis posicionales (dependiendo de los géneros textuales), </li></ul></ul><ul><ul><li>Los coreferentes, </li></ul></ul><ul><ul><li>La estructura de la información (Mann y Thompson) </li></ul></ul><ul><ul><li>Los programas de concordancia </li></ul></ul><ul><ul><li>Análisis léxico (para el examen de los rasgos lingüísticos como los patrones de nominalización, la atribución, la modalidad, etc.), </li></ul></ul><ul><ul><li>Los marcados sintácticos y semánticos (Leech y Fligelstone, 1992) </li></ul></ul>FASE III El procesamiento informático de la estructura del corpus oral y escrito
  9. 9.
  10. 10. Recursos del Proyecto Humanos Informática y software Equipos Materiales Finacieros Oficina/ centro de procesamiento
  11. 11. RECURSOS HUMANOS: Coordinador del Proyecto - Responsabilidades <ul><ul><li>Integrar los esfuerzos de los miembros del equipo para alcanzar los objetivos del proyecto </li></ul></ul><ul><ul><li>Definir la metodología de trabajo </li></ul></ul><ul><ul><li>Proveer recursos </li></ul></ul><ul><ul><li>Evaluar progresos </li></ul></ul><ul><ul><li>Establecer medidas correctivas </li></ul></ul>
  12. 12. Equipo de Proyecto <ul><li>Grupo de personas lideradas por el Coordinador del proyecto. </li></ul><ul><li>Representan áreas de trabajo funcional y roles específicos: </li></ul><ul><li>Coordinador de la construcción del corpus escrito </li></ul><ul><li>Coordinador de la construcción del corpus oral </li></ul><ul><li>03 digitadores </li></ul><ul><li>02 informáticos </li></ul><ul><li>Un especialista en lingüística del corpus </li></ul><ul><li>Un lingüista quechua </li></ul>
  13. 13. Corpus oral y escrito del quechua CORPORA QHICHWA Registrarse Adolfo Zárate Pérez-pa ruwasqan
  1. A particular slide catching your eye?

    Clipping is a handy way to collect important slides you want to go back to later.

×