Corpus del Quechua
Upcoming SlideShare
Loading in...5
×
 

Like this? Share it with your network

Share

Corpus del Quechua

am

  • 887 Views

Qhishwa simi yuyanchanapaq

Qhishwa simi yuyanchanapaq

Statistiken

Views

Gesamtviews
887
Views auf SlideShare
887
Views einbetten
0

Actions

Gefällt mir
0
Downloads
0
Kommentare
0

0 Einbettungen 0

No embeds

Zugänglichkeit

Kategorien

Details hochladen

Uploaded via as Microsoft PowerPoint

Benutzerrechte

© Alle Rechte vorbehalten

Report content

Als unangemessen gemeldet Als unangemessen melden
Als unangemessen melden

Wählen Sie Ihren Grund, warum Sie diese Präsentation als unangemessen melden.

Löschen
  • Full Name Full Name Comment goes here.
    Sind Sie sicher, dass Sie...
    Ihre Nachricht erscheint hier
    Processing...
Kommentar posten
Kommentar bearbeiten

Corpus del Quechua Presentation Transcript

  • 1. Creación de corpus oral y escrito en la lengua quechua (Qhishwa simita chaninchasun)
  • 2. 1. Objetivos
    • Elaborar un corpus digital escrito del quechua con 50 millones de palabras considerando su representatividad y equilibrio.
    • Implementar el etiquetado y marcarje gramatical, semántico, sintáctico y pragmático.
    • Grabar, transcribir y organizar un corpus oral del quechua teniendo presente las variantes dialectales y los registros.
    • Poner a disposición de los investigadores nacionales e internacionales un corpus de referencia del quechua.
  • 3. 2. Descripción del proyecto
    • El proyecto se desarrollará durante dos años, que comprenderá la recolección, el procesamiento, organización del corpus
    • El proyecto está orientado a construir un corpus de referencia digital en quechua con 50 millones de palabra en la lengua escrita y 10 millones de la lengua oral en quechua. Los datos serán tomados del lenguaje natural considerando los dialectos que existen en el quechua, distribuidos de la siguiente manera (Torero, 1974):
  • 4. Dialectos del quechua Q- I Q-II QHISHWA CORPORA
  • 5. 3. Metodología: Uso de Recursos / Costes 02 años Concepción Recopilación textos escritos y orales Marcado, etiquetaje, Recursos informáticos. Producto: Corpus tiempo Esfuerzo
  • 6. 4. ACTIVIDADES: Tareas y subtareas
      • Planificación y organización de actividades
      • Asignación de responsabilidades
      • Lectura del marco teórico.
    FASE I Concepción del proyecto
  • 7.
    • TEXTOS ESCRITOS:
      • Localización de los textos, según zonas geográficas y países.
      • Recopilar un conjunto de textos de documentos escritos: libros, informes u otros documentos.
      • Digitalización de los textos
      • Almacenamiento los textos en archivos clasificados según géneros/ temas
      • Corrección informática y manual de los textos
    • TEXTOS ORALES
      • Localización de las zonas geográficas y países
      • Grabación en lugares de destino
      • Transcripción automática del corpus
      • Ficha técnica
      • Corrección manual de la transcripción
    FASE II: Recopilación y organización de textos en contextos naturales.
  • 8.
      • Marcaje estructural y etiquetaje
      • Preproceso (detección de fechas, números, locuciones, nombres propios...) 
      • Análisis y marcaje morfológicos de acuerdo con los etiquetarios morfológicos
      • Desambiguación lingüística y/o estadística
      • Las inferencias (analizadores automáticos),
      • Las anotaciones (actos de habla: información, opinión, aliento, etc.)
      • Las colocaciones (para Baker resulta útil porque ayuda a resumir las relaciones más importantes entre las palabras),
      • Los análisis posicionales (dependiendo de los géneros textuales),
      • Los coreferentes,
      • La estructura de la información (Mann y Thompson)
      • Los programas de concordancia
      • Análisis léxico (para el examen de los rasgos lingüísticos como los patrones de nominalización, la atribución, la modalidad, etc.),
      • Los marcados sintácticos y semánticos (Leech y Fligelstone, 1992)
    FASE III El procesamiento informático de la estructura del corpus oral y escrito
  • 9.
  • 10. Recursos del Proyecto Humanos Informática y software Equipos Materiales Finacieros Oficina/ centro de procesamiento
  • 11. RECURSOS HUMANOS: Coordinador del Proyecto - Responsabilidades
      • Integrar los esfuerzos de los miembros del equipo para alcanzar los objetivos del proyecto
      • Definir la metodología de trabajo
      • Proveer recursos
      • Evaluar progresos
      • Establecer medidas correctivas
  • 12. Equipo de Proyecto
    • Grupo de personas lideradas por el Coordinador del proyecto.
    • Representan áreas de trabajo funcional y roles específicos:
    • Coordinador de la construcción del corpus escrito
    • Coordinador de la construcción del corpus oral
    • 03 digitadores
    • 02 informáticos
    • Un especialista en lingüística del corpus
    • Un lingüista quechua
  • 13. Corpus oral y escrito del quechua CORPORA QHICHWA Registrarse Adolfo Zárate Pérez-pa ruwasqan