• Teilen
  • E-Mail
  • Einbetten
  • Gefällt mir
  • Speichern
  • Privater Inhalt
Corpus del Quechua
 

Corpus del Quechua

on

  • 817 Views

Qhishwa simi yuyanchanapaq

Qhishwa simi yuyanchanapaq

Statistiken

Views

Gesamtviews
817
Views auf SlideShare
817
Views einbetten
0

Actions

Gefällt mir
0
Downloads
0
Kommentare
0

0 Einbettungen 0

No embeds

Zugänglichkeit

Kategorien

Details hochladen

Uploaded via as Microsoft PowerPoint

Benutzerrechte

© Alle Rechte vorbehalten

Report content

Als unangemessen gemeldet Als unangemessen melden
Als unangemessen melden

Wählen Sie Ihren Grund, warum Sie diese Präsentation als unangemessen melden.

Löschen
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Ihre Nachricht erscheint hier
    Processing...
Kommentar posten
Kommentar bearbeiten

    Corpus del Quechua Corpus del Quechua Presentation Transcript

    • Creación de corpus oral y escrito en la lengua quechua (Qhishwa simita chaninchasun)
    • 1. Objetivos
      • Elaborar un corpus digital escrito del quechua con 50 millones de palabras considerando su representatividad y equilibrio.
      • Implementar el etiquetado y marcarje gramatical, semántico, sintáctico y pragmático.
      • Grabar, transcribir y organizar un corpus oral del quechua teniendo presente las variantes dialectales y los registros.
      • Poner a disposición de los investigadores nacionales e internacionales un corpus de referencia del quechua.
    • 2. Descripción del proyecto
      • El proyecto se desarrollará durante dos años, que comprenderá la recolección, el procesamiento, organización del corpus
      • El proyecto está orientado a construir un corpus de referencia digital en quechua con 50 millones de palabra en la lengua escrita y 10 millones de la lengua oral en quechua. Los datos serán tomados del lenguaje natural considerando los dialectos que existen en el quechua, distribuidos de la siguiente manera (Torero, 1974):
    • Dialectos del quechua Q- I Q-II QHISHWA CORPORA
    • 3. Metodología: Uso de Recursos / Costes 02 años Concepción Recopilación textos escritos y orales Marcado, etiquetaje, Recursos informáticos. Producto: Corpus tiempo Esfuerzo
    • 4. ACTIVIDADES: Tareas y subtareas
        • Planificación y organización de actividades
        • Asignación de responsabilidades
        • Lectura del marco teórico.
      FASE I Concepción del proyecto
      • TEXTOS ESCRITOS:
        • Localización de los textos, según zonas geográficas y países.
        • Recopilar un conjunto de textos de documentos escritos: libros, informes u otros documentos.
        • Digitalización de los textos
        • Almacenamiento los textos en archivos clasificados según géneros/ temas
        • Corrección informática y manual de los textos
      • TEXTOS ORALES
        • Localización de las zonas geográficas y países
        • Grabación en lugares de destino
        • Transcripción automática del corpus
        • Ficha técnica
        • Corrección manual de la transcripción
      FASE II: Recopilación y organización de textos en contextos naturales.
        • Marcaje estructural y etiquetaje
        • Preproceso (detección de fechas, números, locuciones, nombres propios...) 
        • Análisis y marcaje morfológicos de acuerdo con los etiquetarios morfológicos
        • Desambiguación lingüística y/o estadística
        • Las inferencias (analizadores automáticos),
        • Las anotaciones (actos de habla: información, opinión, aliento, etc.)
        • Las colocaciones (para Baker resulta útil porque ayuda a resumir las relaciones más importantes entre las palabras),
        • Los análisis posicionales (dependiendo de los géneros textuales),
        • Los coreferentes,
        • La estructura de la información (Mann y Thompson)
        • Los programas de concordancia
        • Análisis léxico (para el examen de los rasgos lingüísticos como los patrones de nominalización, la atribución, la modalidad, etc.),
        • Los marcados sintácticos y semánticos (Leech y Fligelstone, 1992)
      FASE III El procesamiento informático de la estructura del corpus oral y escrito
    • Recursos del Proyecto Humanos Informática y software Equipos Materiales Finacieros Oficina/ centro de procesamiento
    • RECURSOS HUMANOS: Coordinador del Proyecto - Responsabilidades
        • Integrar los esfuerzos de los miembros del equipo para alcanzar los objetivos del proyecto
        • Definir la metodología de trabajo
        • Proveer recursos
        • Evaluar progresos
        • Establecer medidas correctivas
    • Equipo de Proyecto
      • Grupo de personas lideradas por el Coordinador del proyecto.
      • Representan áreas de trabajo funcional y roles específicos:
      • Coordinador de la construcción del corpus escrito
      • Coordinador de la construcción del corpus oral
      • 03 digitadores
      • 02 informáticos
      • Un especialista en lingüística del corpus
      • Un lingüista quechua
    • Corpus oral y escrito del quechua CORPORA QHICHWA Registrarse Adolfo Zárate Pérez-pa ruwasqan