Aula de acolhimento 09 de setembro 09 de setembro de 2020
O contributo das tecnoloxías da linguaxe na documentación e na revitalización do minderico
1. Vera Ferreira / Peter Bouda
vferreira@cidles.eu pbouda@cidles.eu
Centro Interdisciplinar de Documentação Linguística e Social
Facultade de Filoloxía e Tradución
Departamento de Tradución e Lingüistística
Universidade de Vigo, 21.11.2012
2. Alé covanos do Pregal Palhoto,
os charales do Ninhou frederiquem piar um
lince ancho por os covanos porem o das
caçoas à piadeira sobre a piação e por
fredericarem penetrar a nossa do badelo.
Somos vila franca que sejem antónio forno!
Quando jordarem passos varejem o Ninhou
que é uma terruja cópia pra diante.
Facultade de Filoloxía e Tradución
Departamento de Tradución e Lingüistística
Universidade de Vigo, 21.11.2012
3. Minderico: de código secreto por língua do
quotidiano a língua ameaçada
Documentação do minderico
As tecnologias da linguagem na
documentação e revitalização
Facultade de Filoloxía e Tradución
Departamento de Tradución e Lingüistística
Universidade de Vigo, 21.11.2012
4. Facultade de Filoloxía e Tradución
Departamento de Tradución e Lingüistística
Universidade de Vigo, 21.11.2012
5. Minde: vila no centro de
Portugal, Concelho de Alcanena, Distrito
de Santarém
115 km a norte de Lisboa e 240 km a sul
do Porto
Facultade de Filoloxía e Tradución
Departamento de Tradución e Lingüistística
Universidade de Vigo, 21.11.2012
6. Ninhou (‗Minde‘)
Facultade de Filoloxía e Tradución
Departamento de Tradución e Lingüistística
Universidade de Vigo, 21.11.2012
7. Até aproximadamente 1970: mais de
7000 habitantes
Censos 2011: 3293 habitantes
Vila monoindustrial (indústria têxtil)
Depressão fechada entre os
Planaltos de Santo António e de São
Mamede, em pleno Maciço Calcário
Estremenho
Isolamento geográfico determinante
para o surgimento, uso e
preservação de uma variante
linguística própria
Facultade de Filoloxía e Tradución
Departamento de Tradución e Lingüistística
Universidade de Vigo, 21.11.2012
8. Final do séc. XVII / início do séc. XVIII: os
produtores e vendedores de mantas criaram
construções linguísticas próprias para proteger
o negócio
Minderico como código secreto (língua de
defesa)
Sociolecto: Língua de um grupo socio-
profissional
Facultade de Filoloxía e Tradución
Departamento de Tradución e Lingüistística
Universidade de Vigo, 21.11.2012
9. Evolução
Manter-se como língua secreta (Rotwelsch)
Extinção (Månsing)
Perda do estatuto de língua secreta e redução a
vocabulário específico dentro da língua base
(Lachoudisch)
Língua autónoma (―Language by distance‖ [Kloss
1967: 29], ―Abstandsprache‖ [Hentschel 2003] -
Casúbio)
Facultade de Filoloxía e Tradución
Departamento de Tradución e Lingüistística
Universidade de Vigo, 21.11.2012
10. Alargamento contínuo e criativo do vocabulário
Importância das experiências sócio-culturais
dos mindericos
◦ Metáforas como estratégia de alargamento lexical
leoa ‘trovoada‘ (< pt. leoa)
assassino / assarsino ‗anus‘ (< pt. assassino)
treme-terras ‘Deus‘ (< pt. tremer + terras)
Facultade de Filoloxía e Tradución
Departamento de Tradución e Lingüistística
Universidade de Vigo, 21.11.2012
11. ◦ Metonímias como estratégia de alargamento lexical:
o de alhandra ‗fósforo‘ (< topónimo: Alhandra)
touquim ‗professor‘ (< antropónimo: Touquim)
a do linho ‗toalha‘ (< material: linho)
Alargamento dos contextos de aplicação
Aumento do número de falantes
Minderico como meio de identificação e língua do
dia-a-dia
Distanciamento (morfossintático) em relação ao
português
Facultade de Filoloxía e Tradución
Departamento de Tradución e Lingüistística
Universidade de Vigo, 21.11.2012
12. 1. Construções partitivas elípticas
(a) os do noé = pt. 'animais ‚
(b) o do padre faria = pt. 'papagaio'
2. Incorporação Nominal
(c) A covana jorda as do mestre-grosso as cardosas.
'A mulher veste as calças.' (lit. 'A mulher roupas-põe as calças';
as do mestre-grosso = roupas)
(d) Aqui o covano gambia a do pinto lopes um soletra.
'Eu [masc.] escrevo um livro.' (lit. 'Eu caneta-mexo um livro‗;
a do pinto lopes = caneta)
Facultade de Filoloxía e Tradución
Departamento de Tradución e Lingüistística
Universidade de Vigo, 21.11.2012
13. Desaparecimento do carácter secreto
Meio de comunicação geral (com registo diferenciado)
Sintaxe complexa
Não se restringe à oralidade
Bilinguismo com diglossia
Code switching
Língua ameaçada!
Código ISO 639-3: DRC (língua individual, autónoma e
viva)
Facultade de Filoloxía e Tradución
Departamento de Tradución e Lingüistística
Universidade de Vigo, 21.11.2012
14. Transmissão intergeracional interrompida
Decréscimo acentuado do número de falantes
Perda dos contextos de utilização
Restrição do uso a contextos informais
Pressão do português (língua da administração, do
ensino, da economia, …)
Pouca imposição do minderico nos novos domínios de
comunicação (internet, media)
Falta de documentação e estudo académico detalhados
Falta de reconhecimento oficial a nível nacional
Facultade de Filoloxía e Tradución
Departamento de Tradución e Lingüistística
Universidade de Vigo, 21.11.2012
15. A designação ‗Calão Minderico‘
‗Piação‘ em vez de ‗Calão Minderico‘
Atitude da comunidade de falantes
◦ Microcosmos
◦ Macrocosmos
Número de falantes
◦ Conhecimento activo (150-200, 20 falantes fluentes)
◦ Conhecimento passivo (1000)
Participação activa dos falantes na preservação
do minderico
Facultade de Filoloxía e Tradución
Departamento de Tradución e Lingüistística
Universidade de Vigo, 21.11.2012
17. Charales do Ninhou (Habitantes de Minde)
Facultade de Filoloxía e Tradución
Departamento de Tradución e Lingüistística
Universidade de Vigo, 21.11.2012
18. Focos temáticos da documentação
◦ Produção e venda têxtil
◦ Situações do quotidiano (conversas informais, trabalho
doméstico, comida)
◦ Eventos sociais (inclusive religiosos)
◦ Fauna e flora
Tipo Total
Texto 120
Vídeo 24 (6h 44min 33seg)
Áudio 86 (5h 43min 10seg)
Fotografia 434
Dados recolhidos no âmbito do projecto DoBeS para a documentação
do Minderico
Facultade de Filoloxía e Tradución
Departamento de Tradución e Lingüistística
Universidade de Vigo, 21.11.2012
19. Max-Planck-Institut em Nijmegen
(Holanda)
64 sessões com dados primários
Estrutura do arquivo:
http://corpus1.mpi.nl/ds/imdi_
browser/?openpath=MPI77915%
23
A equipa do CIDLeS continuou a
documentação iniciada no
projecto DoBeS
Facultade de Filoloxía e Tradución
Departamento de Tradución e Lingüistística
Universidade de Vigo, 21.11.2012
20. Software: LEXUS / VICOS
Características das entradas:
◦ 450 Lexemas de 8 domínios semânticos:
Comida
Bebida
Corpo Humano
Casa
Animais
Vestuário
Tempo cronológico e meteorológico
Relações de parentesco
◦ Classe de palavras
Facultade de Filoloxía e Tradución
Departamento de Tradución e Lingüistística
Universidade de Vigo, 21.11.2012
21. ◦ Transcrição fonética e áudio
◦ Definição em português e inglês
◦ Formas alternativas
◦ Formas de plural
◦ Informações etimológicas
◦ Observações de carácter morfossintático e pragmático
◦ Exemplos concretos de utilização com tradução em
português e inglês
◦ Vídeos
◦ Fotos
◦ Textos
◦ Relações semânticas
Facultade de Filoloxía e Tradución
Departamento de Tradución e Lingüistística
Universidade de Vigo, 21.11.2012
22. Facultade de Filoloxía e Tradución
Departamento de Tradución e Lingüistística
Universidade de Vigo, 21.11.2012
23. Facultade de Filoloxía e Tradución
Departamento de Tradución e Lingüistística
Universidade de Vigo, 21.11.2012
24. Language Technologies are integral part of
computer-human-interaction
Only LT for major languages receive vast financial
support
LT are obligatory for active language use in
electronic communication (text completion in
SMS, spell checking, speech recognition, …)
CIDLeS is concerned with software development
in LT for lesser-used languages
Document, teach and revitalize lesser-used
languages
Facultade de Filoloxía e Tradución
Departamento de Tradución e Lingüistística
Universidade de Vigo, 21.11.2012
25. URL: http://media.cidles.eu/poio
Collection of software tools
◦ Poio Interlinear Editor: Add morpho-syntactic annotation
to transcriptions
◦ Poio Analyzer: Search and analyze corpus with morpho-
syntactic annotations
◦ Poio API: Python library to access Elan, Toolbox and
Kura files
Open Source software (GPL), free download
Facultade de Filoloxía e Tradución
Departamento de Tradución e Lingüistística
Universidade de Vigo, 21.11.2012
26. Interlinear text consists of 3-5 lines/tiers:
◦ Source text (for example in Minderico [drc])
◦ Word and morpheme segmentation
◦ Morpho-syntactic annotations
◦ Translation
Minderico:
Facultade de Filoloxía e Tradución
Departamento de Tradución e Lingüistística
Universidade de Vigo, 21.11.2012
27. Edit interlinear versions of corpus files
Source files are transcriptions or any other
monolingual files
Currently only ELAN .eaf files, Toolbox and Praat
support planned
Allows to easily add morpho-syntactic annotations
to ELAN files
Based on fieldworkers‘ needs
Facultade de Filoloxía e Tradución
Departamento de Tradución e Lingüistística
Universidade de Vigo, 21.11.2012
28. Facultade de Filoloxía e Tradución
Departamento de Tradución e Lingüistística
Universidade de Vigo, 21.11.2012
29. Open a batch of ELAN and Toolbox files and
search on tiers
Search in all tiers, results presented as full
interlinear texts
Supports logical operations and regular
expressions for search terms
Descriptive Grammars based on Language
Documentation corpora
Developed together with Prof. Johannes
Helmbrecht at University of Regensburg (DoBeS
project „Hocąk― [win])
Facultade de Filoloxía e Tradución
Departamento de Tradución e Lingüistística
Universidade de Vigo, 21.11.2012
30. Facultade de Filoloxía e Tradución
Departamento de Tradución e Lingüistística
Universidade de Vigo, 21.11.2012
31. Python library to access ELAN, Toolbox and Kura
interlinear texts
Supports morpho-syntactic and part-of-speech
annotations
Implements CorpusReader API of Natural
Language Toolkit (http://www.nltk.org)
Basis of Poio ILE and Poio Analyzer
Facultade de Filoloxía e Tradución
Departamento de Tradución e Lingüistística
Universidade de Vigo, 21.11.2012
32. Facultade de Filoloxía e Tradución
Departamento de Tradución e Lingüistística
Universidade de Vigo, 21.11.2012
33. URL: http://media.cidles.eu/labs/wordbyword
Facultade de Filoloxía e Tradución
Departamento de Tradución e Lingüistística
Universidade de Vigo, 21.11.2012
34. Developed for Minderico learners in the courses
organised by CIDLeS (adult courses)
Since 2010 also used in Minderico courses at the
local school (teenager courses)
Since 2012 also used in the training of Minderico
teachers for the local school (the training is given
at CIDLeS)
8 Lessons with ~30 words each
Lessons by semantic fields
New lessons will come soon!
Facultade de Filoloxía e Tradución
Departamento de Tradución e Lingüistística
Universidade de Vigo, 21.11.2012
35. Available for download as free software (GPL)
Voice output uses Portuguese TTS by Linguatec
language technologies (http://www.linguatec.net)
Written in Python, based on PyQt
Lesson files are YAML (text files), open for new
lessons in any language
◦ Easy to adapat for and use in the langugages of other
communities
Runs on Nokia mobile phones
Centro Interdisciplinar de Documentação Linguística e Social
Jornadas Europeias do Património 2012
www.cidles.eu
37. Created during a fieldwork stay in Minde, within
the DoBeS project "Minderico - An endangered
language in Portugal"
Based on Open Street Map data
GPS data was collected and map was drawn
using Open Source software
Open Layers for overlay of photos and audio
It is used by the community to promote Minde and
the events that take place in the village
Facultade de Filoloxía e Tradución
Departamento de Tradución e Lingüistística
Universidade de Vigo, 21.11.2012
38. O Touquim Xaral is a
Minderico course of 13
lessons in different fascicles
It was organised by CIDLeS
and delivered with Jornal de
Minde
We are now preparing:
◦ an interactive html version of the
course
◦ a mobile application
Facultade de Filoloxía e Tradución
Departamento de Tradución e Lingüistística
Universidade de Vigo, 21.11.2012
39. Strong focus on Open Source software
For „normal― users and researchers
Development for the needs of speech
communities
Based on experience in fieldwork and corpus
analysis in language documentation projects
Facultade de Filoloxía e Tradución
Departamento de Tradución e Lingüistística
Universidade de Vigo, 21.11.2012
40. Endruschat, Annette / Ferreira, Vera 2006. Das Minderico. Lusorama 65-66, 207-229.
Ferreira, Vera 2009. Moinho da fonte ancho da piação dos charales do Ninhou – uma do badalo a
escadeirar na Terruja do Camões. Jornal de Minde nº 610, 8.
Ferreira, Vera 2011. Eine Dokumentationslingistische Beschreibung des Minderico. In:
Endruschat, Annette / Ferreira, Vera (Hrsg.). Sprachdokumentation und Korpuslinguistik –
Forschungsstand und Anwendung. München: Martin Meidenbauer, 143-170.
Ferreira, Vera / Bouda, Peter 2009. Minderico: an endangered language in Portugal. In Austin, Peter
K. / Bond, Oliver / Charette, Monik / Nathan, David / Sells, Peter (eds.). Proceedings of Conference
on Language Documentation and Linguistic Theory 2. London: SOAS, 95-106.
Frazão, Francisco Santos Serra 1939. Calão minderico — Alguns termos do «calão» que usam os
cardadores e negociantes de Minde, concelho de Alcanena. Revista Lusitana, vol. XXXVII. Lisboa:
Livraria Clássica Editora, 101-143.
Gomes, Jorge Rodriguez 2004. Estudo comparativo da formaçom de gírias gremiais galegas e
castelhanas, Dissertação de Doutoramento, Vigo (manuscrito).
Hentschel, Gerd 2003. New minor ‗Abstandsprachen‘ under the roof of a genetically close literary
language? The case of Polish vs. Kashubian, Silesia and Podhalean. In: Sherzer; Joel / Stolz, Thomas
(eds.). Minor languages. Approaches, definitions, controversies. Bochum: Brockmeyer, 59-74.
Martins, Abílio Madeira et al. (coord.) 2004. Piação dos Charales do Ninhou. Minde: CAORG.
Martins, Abílio Madeira / Agostinho Nogueira 2002. Minde. História e Monografia. Minde: Grafiminde.
Mithun, Marianne 1984. The Evolution of Noun Incorporation. Language 60, 874-894.
Mithun, Marianne / Corbett, Greville G. 1999. The Effect of Noun Incorporation on Argument Structure.
In Lunella Mereu (ed.). Boundaries of Morphology and Syntax. Amsterdam: John Benjamins, 49-71.
Facultade de Filoloxía e Tradución
Departamento de Tradución e Lingüistística
Universidade de Vigo, 21.11.2012