SlideShare ist ein Scribd-Unternehmen logo
1 von 11
Downloaden Sie, um offline zu lesen
PARECER TÉCNICO SOBRE O LAUDO Nº 710/2023 – SETEC/SR/PF/RS
Na condição de professor universitário de linguística, coordenador do Laboratório de
Fonética da Universidade Federal de São Carlos e pesquisador na área de fonética forense há
pelo menos dez anos, fui, em função da minha especialidade acadêmica, solicitado pelo
escritório do Doutor Pedro Serrano, Walfrido Warde e Rafael Valim advogados associados, os
quais representam o Juiz Federal Eduardo Appio, a realizar análise técnica e parecer a respeito
do Laudo de Perícia Criminal Federal nº 710/2023, emitido pelo Setor Técnico-Científico da
Superintendência Regional de Polícia Federal no Rio Grande do Sul (SETEC/SR/PF/RS), ao
qual passarei a me referir como Laudo no restante deste documento.
1. Dos objetivos
O presente parecer técnico tem como objetivo analisar os fundamentos, procedimentos
técnicos e as conclusões apresentadas no referido Laudo. Usarei para tanto meus
conhecimentos técnicos nas áreas da linguística, especialmente da fonética e minha
experiência como pesquisador na área da fonética forense. Tomarei como referência para a
análise dos fundamentos e procedimentos técnicos empregados na tarefa de comparação de
vozes em contexto forense a literatura especializada na área, que será citada quando
pertinente, e o protocolo de análise fonético-forense para comparação de locutor
sistematizado e apresentado em Barbosa et al. (2020)1
.
2. Do material analisado e do propósito do Laudo
Para emitir o presente parecer, foram disponibilizadas as mesmas gravações analisadas
pelo Laudo. Os detalhes técnicos do material padrão e do material questionado são muito bem
descritos no Laudo e não irei repeti-los aqui. Registro apenas que as somas de verificação de
tipo SHA-256 e a duração das duas amostras coincidem exatamente com as reportadas no
Laudo nas tabelas 1 e 2 (pp. 1-2). No que segue, descrevo a situação de interação verbal que
caracteriza as duas amostras, por ser informação relevante para considerações que serão feitas
posteriormente no presente parecer.
O material padrão é uma Audiência de Custódia registrada em vídeo, na qual os
interactantes estão em copresença: parte está no mesmo ambiente físico e outros participam
por meio de videoconferência e todos podem se ouvir e ver-se mutuamente durante a
interação. A voz do Juiz e Presidente da Audiência de Custódia é considerada a voz padrão.
Na amostra questionada, há duas pessoas que falam. A voz cuja identidade interessa
estabelecer vem de uma chamada feita para um aparelho celular por meio do aplicativo de
chamadas VOIP Skype. A pessoa que recebe a ligação ouve a chamada em viva voz. A
interação é registrada em formato de vídeo, gravado por meio de outro aparelho celular por
um terceiro participante, que está próximo à pessoa que segura o celular que está recebendo a
ligação.
Dadas as características técnicas e conversacionais das amostras padrão e questionada,
é relevante notar que duas condições de incongruência se verificam: a de condição técnica de
gravação e uma incongruência de estilo de elocução. A primeira está relacionada ao fato da
gravação da voz do falante de interesse na amostra padrão ter sido uma gravação direta em
1
BARBOSA, P. A. et al. (EDS.). Análise fonético-forense em tarefa de comparação de locutor. 1. ed.
Campinas: Millenium Editora, 2020.
microfone de qualidade e a amostra questionada resultar de uma transmissão sujeita a filtagem
e compressões, que resultam em perda de qualidade do sinal acústico. A principal limitação
imposta por essa incongruência é a limitação em relação ao tipo de exame que pode ser feito.
Seria importante que o Laudo tivesse mencionado esse fato na seção III.2, que discute a
adequabilidade das amostras. A respeito da incongruência estilística, faço comentários mais
detalhados na seção 5 do presente parecer.
O objetivo estabelecido para o Laudo é testar a hipótese segundo a qual a voz padrão e
a voz questionada têm a mesma origem, isto é, que a voz do Juiz e Presidente da Audiência de
Custódia registrada no material padrão é a mesma que fala na chamada feita ao portador do
celular no vídeo que compõe o material questionado.
A título de perfil sociodemográfico, cabe informar que o falante de interesse na
amostra padrão é um indivíduo do sexo masculino, com 53 anos completos, com ensino
superior completo, com atuação na área jurídica. Nasceu em uma cidade do interior do estado
do Rio Grande do Sul, residiu por 10 anos em Porto Alegre e posteriormente passou a viver
no estado do Paraná, a maior parte do tempo na cidade de Curitiba. O que se pode depreender
dessas informações é que o falante passou a maior parte da sua vida em idade produtiva longe
de sua cidade e estado natais, de modo que se pode esperar que as características de sua fala
provavelmente não são as típicas de alguém nascido no mesmo estado e cidade. Além disso,
pode-se esperar que sua fala apresente as características de alguém que viveu a maior parte da
sua vida em ambiente urbano e com alto grau de escolarização.
3. Da adequabilidade dos materiais
As duas amostras são declaradas “adequadas para a realização do exame de Comparação de
Locutor” no Laudo. Os critérios usados para fundamentar essa declaração não são
apresentados explicitamente no Laudo, nem se aponta, por meio de citação bibliográfica,
material de consulta que fundamente a decisão. Em especial, não se faz nenhuma
consideração em relação às diferenças de qualidade técnica e à incongruência estilística que
existem entre as duas amostras e as consequências disso para a realização de diferentes
exames nos materiais, como apontei na seção anterior do presente parecer.
4. Das análises apresentadas
A seção III.4.1 do Laudo apresenta o que chama de “características linguísticas de cunho
perceptual” encontradas no material questionado e no material padrão e faz considerações de
natureza comparativa entre essas observações. Os resultados da comparação entre essas
características aparecem na forma de uma lista de oito itens. No que segue, replico na
integralidade cada um dos oito itens (destacados em itálico), cujo conteúdo analiso
individualmente.
a) As vozes padrão e questionada apresentam características de indivíduos adultos e do sexo
masculino;
A inferência a respeito do sexo do falante da amostra questionada não é problemática,
mesmo dada a baixa qualidade técnica da gravação. O mesmo vale para o falante na gravação
padrão. O registro melódico grave e timbre vocal empregado por ambos, ambas informações
depreensíveis pela audição das amostras, dão fundamento para essa firmação.
b) Os dois locutores apresentam repertório verbal e sotaque compatível com falantes da
região sul do Brasil;
Em relação a esse item, a primeira consideração a fazer é que, do ponto de vista das
divisões dialetológicas do Brasil, o que se chama de “região sul” é um espaço geográfico
muito amplo, que compreende mais territórios além do três estados da federação que
compõem a região sul na divisão usada pelo IBGE (Paraná, Santa Catarina e Rio Grande do
Sul). Historicamente, o que a tradição dialetológica brasileira chama de “região sul” engloba
áreas que avançam, na direção setentrional, até o sul dos estados de Goiás e Mato Grosso
(SANTOS, 2020)2
. Mesmo se tomados apenas os três estados da região sul definida pelo
IBGE, cada estado apresenta variações linguísticas relevantes em níveis de análise linguística
diversos, como, por exemplo, a fonética, a fonologia, a morfossintaxe e o léxico. Se
consideradas apenas a variação ao nível do léxico e de alguns fenômenos fonético-
fonológicos, mesmo um estado tomado individualmente pode ser subdividido em diferentes
zonas lexicais, como se pode ver em Romano (2018)3
e Chofard e Margottti (2019)4
. Portanto,
a afirmação de compatibilidade entre os locutores com relação à região dialetal careceria de
maior especificação para que essa observação pudesse contribuir de forma importante como
elemento para a comparação entre os locutores.
A respeito de “repertório verbal”, não está claro o que o Laudo entende por essa
expressão e que manifestações linguísticas ela recobre. Se entendermos essa expressão no
sentido mais limitado de seleção vocabular, isto é, a escolha das palavras usadas por um
falante em sua produção verbal, o exame do vocabulário empregado pela Voz 1 na amostra
questionada mostra não haver nenhum item que chame particularmente a atenção por seu
caráter regional5
, em particular aquelas que são comumente associadas às variedades
linguísticas faladas nos estados da região sul do país. Nesse sentido, consultar as cartas
geolinguísticas Romano (2018) e Chofard e Margottti (2019) para consultar as variantes
lexicais prevalentes nos chamados “falares do sul”. O Laudo, no entanto, não especifica quais
itens lexicais presentes nas amostras questionada e padrão seriam evidência do pertencimento
de ambos os falantes à zona dialetal sulista, mesmo que ela não seja delimitada no texto nem
espacialmente, nem em suas dimensões linguísticas.
No que diz respeito a “sotaque”, esse é um termo do jargão linguístico para fazer
referência ao modo de pronunciar uma língua que é típico de uma determinada comunidade
de fala (TRASK, 2004)6
. Faz referência sobretudo a aspectos da pronúncia de segmentos
fonéticos individuais, mas pode englobar também aspectos da organização melódica e rítmica
da fala (BARBOSA, 2019)7
. Nesse sentido, o Laudo não arrola nenhuma literatura para
caracterizar do ponto de vista fonético-fonológico o sotaque ou os sotaques típicos dos falares
2
BARBOSA, P. A. et al. (EDS.). Análise fonético-forense em tarefa de comparação de locutor. 1. ed.
Campinas: Millenium Editora, 2020.
3
SANTOS, L. A. DOS. Pelos caminhos das áreas dialetais e lexicais do Brasil. Caletroscópio, v. 8, n. 2, p.
44–62, 2020.
4
ROMANO, V. P. Áreas lexicais no Centro-Sul do Brasil sob uma perspectiva geolinguística. Revista de
Estudos da Linguagem, v. 26, n. 1, p. 103–145, 2018.
5
CHOFARD, A.; MARGOTTI, F. W. O português falado no Sul do Brasil: um balanço das áreas dialetais a
partir de itens lexicais do ALiB. Polifonia, v. 26, p. 296–316, 2019.
6
Uma vez que o Laudo não traz a transcrição ortográfica do diálogo que constitui a amostra questionada,
considerei, para essa análise, a transcrição do teor da gravação questionada referida no Laudo, que consta
das páginas 14 e 15 do documento SEI 6595089 do processo SEI 0003142-16.2023.4.04.8000; doc.
6642989.
7
TRASK, R. L. Dicionário de linguagem e linguística. 1. ed. São Paulo: Contexto, 2004.
da região sul nem apresenta dados extraídos das duas amostras que pudessem servir para
caracterizar minimamente na dimensão fonético-fonológico as falas presentes nas duas
amostras.
A falta de critérios objetivos para definir as duas dimensões linguísticas mencionadas
nesse item, combinada à ausência de qualquer dado extraído das amostras enfraquece bastante
o peso evidencial dessa observação.
c) Convergência prosódica, ou seja, entonação, ritmo, acento (intensidade, altura, duração)
compatíveis entre material padrão e questionado;
Ritmo e entoação são manifestações de fenômenos linguísticos de ordem fonética e
fonológica que dizem respeito a variações observáveis apenas quando se considera
enunciados como um todo e não apenas fones individuais e são, por isso, chamados também
de fenômenos suprassegmentais (LEHISTE, 1970)8
. Mais especificamente, entoação diz
respeito a modulações na curva de frequência fundamental da fala (abreviada por f0 no
restante do texto) ou curva melódica, responsáveis por gerar, ao longo de um enunciado, de
pontos graves ou agudos. Esses padrões de regiões graves e agudas podem ter funções
linguísticas (nesse caso, são chamados tons) ou paralinguísticas, como a expressão de atitudes
(ironia, surpresa e desconfiança, por exemplo), e de estados emocionais (DE MORAES;
RILLIARD, 2014)9
. No que diz respeito ao seu uso para caracterizar a fala, ritmo pode ser
entendido como a sensação perceptual resultante da integração entre duas tendências distintas,
a regularidade na enunciação das sílabas e a alternância entre sílabas proeminentes e não
proeminentes (BARBOSA, 2019). Ambos são fenômenos muito complexos de analisar e
caracterizar, dado que se manifestam por meio de diferentes correlatos acústicos e
perceptuais. Para a entoação, o principal correlato físico é a f0 e o alinhamento entre
modulações no contorno de f0 e elementos pontuais na cadeia da fala. Para a análise e
caracterização do ritmo, parâmetros acústicos relevantes são alongamentos de unidades como
a sílaba em certas posições, pausas e a modulação geral da duração ao longo do enunciado,
além da variação da intensidade e do esforço vocal (BARBOSA, 2019). Tanto a entoação
quanto o ritmo são fenômenos sujeitos a variação em função de região geográfica, estilo de
elocução e escolhas estilísticas individuais. Em função dessa multiplicidade de determinantes,
a caracterização do ritmo e da entoação de um falante e sua comparação com os padrões de
outros falantes não é simples de ser feita e a mera apreciação auditiva sem o uso de conceitos
e metalinguagem apropriada é insuficiente para uma descrição adequada dos padrões
entoacionais e rítmicos presentes nas amostras. Neste item, o Laudo menciona alguns
parâmetros acústicos – intensidade, altura e duração –, sugerindo que teriam sido analisados.
Não há, no entanto, não se diz se são tomados ali em sua face perceptual ou como parâmetros
acústicos analisados por meio instrumental. Além disso, o Laudo não menciona nenhum dado
ou análise concreta, qualitativa ou quantitativa, feita a partir da observação dos três
parâmetros mencionados. Finalmente, não há menção a qualquer critério que teria sido
utilizado para estabelecer o que o Laudo caracteriza como “convergência”.
É relevante a essa altura mencionar a questão de como a literatura trata do uso de
parâmetros entoacionais e rítmicos especificamente em tarefas de comparação entre vozes em
contexto forense. Há um número limitado de trabalhos que tratam especificamente desse tema
8
BARBOSA, P. A. Prosódia. 1. ed. São Paulo: Parábola, 2019.
9
LEHISTE, I. Suprasegmentals. Cambridge, MA: MIT Press, 1970.
(HE; DELLWO, 201610
; NOLAN, 200211
) e não há, até o presente momento, protocolos de
análise aceitos consensualmente. Em especial, nenhum trabalho acadêmico recomenda que
análises desse tipo sejam feitas de forma puramente perceptual, sem o apoio de uma
metalinguagem específica e com o cotejo de diferentes parâmetros acústicos extraídos das
amostras de áudio a serem comparadas.
d) Compatibilidade de taxa de elocução entre questionado e padrão;
Taxa de elocução é uma expressão que faz referência a um índice que mede o número
de ocorrências de determinada unidade linguística (que em geral é a palavra ou a sílaba) por
unidade de tempo, em geral minutos quando a unidade linguística é a palavra, ou segundos,
quando é a sílaba. Valores maiores indicam uma fala mais rápida e valores menores, uma fala
mais lenta. Há diferentes maneiras de implementar esse índice e esta escolhas podem afetar
sua relevância para uma determinada tarefa. A chamada taxa de elocução inclui na duração
das unidades linguísticas as pausas silenciosas que podem acompanhar as sílabas em pontos
proeminentes no enunciado. Quando essas pausas são excluídas do cômputo, o índice é
chamado de taxa de articulação. A literatura especializada em fonética forense sugere que a
taxa de articulação é um índice com maior poder discriminador do que a taxa de elocução.
Isso acontece porque o número e a duração das pausas em um enunciado dependem de muitos
fatores, desde os propriamente linguísticos como a estrutura sintática dos enunciados até
fatores como o estilo de elocução (se estamos falando de forma espontânea ou lendo, ou em
situações em que a fala é planejada com antecedência ou elaborada em tempo real). Por isso,
considera-se que a taxa de articulação reflita melhor padrões motores possivelmente
idiossincráticos e resistentes tanto a variações na situação comunicacional e até mesmo a
tentativas de disfarce vocal (ERIKSSON, 2011)12
. Quanto ao poder discriminador da taxa de
articulação em situação de comparação de vozes, a literatura aponta que ele é moderado
(OLIVEIRA, 2021)13
.
No Laudo, afirma-se que a taxa de elocução foi analisada, escolha que já mereceria
uma justificativa, uma vez que a taxa de articulação seria uma escolha mais apropriada.
Segundo, não se explicita o método usado para o cálculo da taxa de elocução, isto é, se a
unidade linguística escolhida foi palavra, sílaba ou fone, por exemplo. Não se mencionam os
valores da taxa calculada para as amostras questionada e padrão. Não é possível saber, por
exemplo, se a ausência dessas informações indica que se recorreu a uma estimativa perceptual
da taxa. Terceiro, o Laudo afirma que há “compatibilidade” entre as taxas de elocução das
amostras questionada e padrão, embora não seja possível inferir o critério usado para
estabelecer essa semelhança. A falta dos valores específicos estimados a partir das duas
amostras impede que se julgue a relevância da similaridade entre amostra questionada e
padrão, além de impedir que se estabeleça a prevalência dos valores observados no contexto
10
DE MORAES, J. A.; RILLIARD, A. Illocution, attitudes and prosody: A multimodal analysis. Em: RASO,
T.; MELLO, H. (Eds.). Studies in Corpus Linguistics. Amsterdam: John Benjamins Publishing Company,
2014. v. 61p. 233–270.
11
HE, L.; DELLWO, V. The role of syllable intensity in between-speaker rhythmic variability. International
Journal of Speech Language and the Law, v. 23, n. 2, p. 243–273, 21 nov. 2016.
12
NOLAN, F. Intonation in speaker identification: an experiment on pitch alignment features. Forensic
Linguistics, v. 9, n. 1, p. 3–21, 2002.
13
ERIKSSON, A. Aural/acoustic vs. automatic methods in forensic phonetic case work. Em: NEUSTEIN, A.;
PATIL, H. A. (Eds.). Forensic Speaker Recognition: Law Enforcement and Counter-terrorism. [s.l.]
Springer, 2011. p. 41–70.
de uma população relevante. Deste modo, a evidência relatada nesse item não pode ter peso
relevante a favor ou contra a hipótese de que as amostras têm a mesma origem.
f) Os locutores possuem voz grave, com a presença de trechos de laringalização (creaky
voice/vocal fry);
A afirmação de que os locutores nas duas amostras têm voz relativamente grave não é
de todo problemática. O exame perceptual das duas amostras sugere que o registro tonal e o
timbre vocal nas duas poderia ser classificado como relativamente graves. Nesse aspecto, há
semelhança entre as duas. Podemos observar que o valor mais típico (ou a moda) de f0 é de
110 Hz nas duas amostras, informação que pode ser observada nas figuras 4 e 5 do Laudo.
Tomando os valores de estatística populacional de f0 para o português brasileiro reportados
em Cunha (2023)14
, é possível ver que a moda de f0 na população masculina brasileira é de
aproximadamente 122 Hz e seu desvio-padrão é de aproximadamente 22 Hz. Do ponto de
vista da tipicidade, pode-se notar que embora as duas vozes sejam semelhantes nesse quesito,
o nível típico de f0 das duas, que está em torno de 12 Hz abaixo da moda populacional, não é
especialmente atípico, dado o desvio-padrão típico na população, que é de 22 Hz. Isso
significa que uma quantidade alta de falantes além daquele cuja voz aparece na amostra
padrão poderia ter uma moda de f0 igual ou muito próxima à do falante da gravação
questionada. Portanto, o valor discriminador da observação relatada nesse item é de baixo
peso.
No que diz respeito à presença de trechos com laringalização, a seção 5 do presente
parecer traz uma apreciação mais detalhada da relevância desse achado em conjunto com os
comentários a respeito dos resultados da análise acústica do parâmetro f0 trazidos pelo Laudo.
g) Aspirações recorrentes em ambos materiais;
Não está claro o que se quer dizer com “aspiração” no contexto do Laudo. O termo, na
literatura fonética, faz referência ao fenômeno do atraso do vozeamento de vogal que segue
uma consoante plosiva, de modo a formar uma fricativa glotal entre a soltura da oclusão e o
início do vozeamento da vogal seguinte. Não está claro se o termo está sendo usado no Laudo
nessa acepção estrita ou se em um sentido mais amplo para fazer referência genericamente a
fenômenos como a presença de ruído audível de inspiração e expiração. Em qualquer dos
casos, para que essa observação tenha algum peso evidencial faltam: 1) uma caracterização
fonética mínima do fenômeno; 2) apresentação de exemplos relevantes extraídos das duas
amostras em exame que mostrasse padrões semelhantes do fenômeno nas duas amostras em
exame; 3) uma estimativa precisa da taxa de ocorrência dos fenômenos nas duas amostras, de
modo que o adjetivo “recorrentes” faça algum sentido e 4) menção de dados de prevalência do
fenômeno na população de interesse. A reunião desses fatores impede julgar adequadamente o
valor evidencial dessa observação, dado seu caráter genérico.
h) Observados registros semelhantes a leve disfluência nos materiais questionados e padrão
com a presença de bloqueios, repetições de palavras e prolongamentos de sons;
14
OLIVEIRA, J. C. C. Multiparametric analysis of phonetic-acoustic measures in genetically and non-
genetically related speakers: implications for forensic speaker comparison. Tese de doutorado—
Campinas: Universidade Estadual de Campinas, 2021.
Em relação às ocorrência de disfluência, nenhum exemplo concreto dos tipos de
disfluência citados no Laudo – “bloqueios, repetições de palavras e prolongamento de sons” –
é apresentado que pudesse servir para sugerir um padrão semelhante e idiossincrático de
ocorrência nas duas amostas. Não se apresenta nenhum quantificação a respeito da
prevalência dos diferentes tipos de hesitação nas duas amostras que pudesse também sugerir
padrões recorrentes. Portanto, do ponto de vista da semelhança entre amostra padrão e
questionada a observação é simplesmente declaratória e não é possível avaliar sua
propriedade.
Do ponto de vista da tipicidade, a literatura da área de fonética forense carece de
padrões estabelecidos a respeito do poder dos eventos de disfluência como variável
identificadora de falante. Um dos complicadores dessa tarefa é que eventos de disfluência
“fazem parte das produções faladas de todos [ênfase da autora] os locutores, tenham eles
distúrbios de comunicação ou não” (MERLO, 2006, p. 20)15
. Desse modo, na falta de estudos
estabelecidos a respeito do tema, a atitude mais prudente é considerar que apenas ocorrências
patentemente idiossincráticas de disfluências sejam levadas em conta como indicador de
identidade de falante. No caso do Laudo, como não há nenhuma evidência que aponte
firmemente para um padrão idiossincrático que se manifestasse nas duas amostras, pode-se
dizer que o valor evidencial da declaração presente nesse item do Laudo é baixo.
5. Da análise acústica
No situação analisada no Laudo, a gravação da amostra questionada é uma conversa
telefônica (os dois interlocutores envolvidos não estão à vista um do outro) e a amostra padrão
é uma conversa na qual os interactantes estão em copresença: parte está no mesmo ambiente
físico e outros participam por meio de videoconferência e todos podem se ouvir e ver-se
mutuamente durante a interação. Essa situação cria duas condições de incongruência:
condição técnica de gravação (gravação direta em microfone versus transmissão
telefônica/telemática) e estilo de elocução (conversação face a face versus conversação
telefônica). A respeito do chamado “efeito telefônico”, a literatura aponta um aumento em
torno de 5 Hz para a fala telefônica em comparação à fala gravada em interação face a face. O
aumento é de 7 Hz na f0 mediana no caso do português brasileiro (PASSETTI, 2018, p. 58)16
,
que é compatível com valores observados em outras línguas.
O Laudo reporta os valores 98,77 Hz e 95,88 Hz para o valor de base17
das amostras
questionada e padrão, respectivamente. Considerando que a extração dos valores de f0 da
amostra questionada não foi afetada por uma quantidade elevada de erros causados pela baixa
qualidade do áudio, a similaridade entre as amostras é alta. Ainda assim, é possível imaginar
que a pequena diferença encontrada nos valores encontrados pode ser de fato maior em
função tanto da incongruência técnica quanto estilística a que nos referimos anteriormente.
Para estabelecer a tipicidade desses valores, podemos tomá-los em relação à
distribuição populacional do valor de base na população brasileira do sexo masculino. Os
15
CUNHA, M. S. DA. Estatísticas populacionais da frequência fundamental do português brasileiro para
uso em fonética forense. Dissertação de Mestrado—São Carlos: Universidade Federal de São Carlos, 2023.
16
MERLO, S. Hesitações na fala semi-espontânea: analise por séries temporais. Dissertação de Mestrado—
Campinas: Universidade Estadual de Campinas, 2006.
17
PASSETTI, R. R. Estudo acústico-perceptual do estilo de fala telefônico com implicações para a
verificação de locutor em português brasileiro. Tese de doutorado—Campinas: Universidade Estadual de
Campinas, 2018.
valores para a média e desvio-padrão da distribuição populacional do valor de base, obtido em
Cunha (2023) são, respectivamente, 106,3 Hz e 18 Hz. Assumindo que essa população seja
bem descrita por uma distribuição de probabilidade normal ou gaussiana, é possível estimar
que aproximadamente 33,8% da população brasileira tenha um valor de base igual ou menor
ao que foi observado na amostra questionada, incluído aí o falante da amostra padrão. Essa
alta porcentagem de falantes com um valor de base igual ou menor ao observado na amostra
questionada significa que assumir, com base na proximidade entre os valores reportados no
Laudo, que o falante da amostra questionada é também o produtor da amostra questionada
tem uma alta probabilidade de gerar um falso positivo na identificação, o que seria
extremamente indesejável. Portanto, o possível peso que a alta similaridade nesse parâmetro
poderia exercer em favor de uma hipótese de mesma origem para amostra questionada e
padrão é bastante atenuado pela alta tipicidade de ambos os valores na população relevante.
Ainda na seção III.4.2 do Laudo, são apresentados os histogramas das distribuições de
f0 das amostras questionada e padrão (figuras 4 e 5). Os histogramas agrupam os valores da
amostra em intervalos de classe de 10 Hz e mostram valores que vão de 50 a 200 Hz. O
Laudo afirma haver alta compatibilidade entre os histogramas, baseado no fato de que o
intervalo de classe modal de ambos é 110 Hz, embora não deixe claro se houve aplicação de
algum outro procedimento além do exame visual. Nos dois histogramas pode-se ver a
ocorrência de uma cauda à esquerda do valor modal, com valores concentrados entre 80 e 50
Hz. Dados os valores modais de f0 das duas distribuições, essa concentração relativa de
ocorrências de f0 quase uma oitava abaixo da moda amostral é compatível com instâncias de
vozeamento não modal, em particular voz crepitante ou laringalizada. Essa observação
acústica corrobora o item (f) da seção III.4.1 do Laudo, que aponta a presença de eventos de
vozeamento laringalizado em ambas as amostras. A esse respeito, uma questão técnica precisa
ser levantada. Embora relativamente robustos, o algoritmos de extração da frequência
fundamental estão sujeitos a erros de estimação, que aumentam conforme piora a qualidade da
gravação (TORIKAI, 2015)18
. Um dos erros mais comuns é o chamado “erro de oitava”, que
consiste na estimação errônea da f0 em uma determinada janela de análise, de modo que o
valor retornado é o dobro ou metade do que o correto. Considerando, especialmente no caso
da amostra questionada, que as ocorrências de f0 da cauda esquerda têm valores que são
próximos à metade dos valores de f0 mais típicos da amostra, há o risco de que as ocorrências
vistas naquela cauda possam, pelo menos em parte, ter resultado de erros de oitava na
extração. O Laudo não traz considerações mais detalhadas acerca dos procedimentos
empregados na extração da f0 nas amostras, de modo que não se sabe se houve uma
verificação manual dos valores obtidos pela extração automática, que parece ter sido feita por
intermédio do programa de análise acústica Praat.
Partindo da assunção de que todos os valores presentes em ambos os histogramas
estejam livres de erros de extração, cabe discutir a tipicidade da semelhança entre os
histogramas das amostras questionada e padrão. Como dito no parágrafo anterior, é possível
associar a cauda esquerda naqueles histogramas à presença de eventos de vozeamento não
modal, em especial voz crepitante. Essa hipótese é corroborada, por exemplo, em Silveira e
18
Afirma-se, na nota de rodapé 3 do Laudo, que o valor de base corresponderia à “posição de relaxamento que
uma articulação retorna depois de uma excursão no espaço articulatório”. O conceito de “F0 baseline”, que
pode ser traduzido para o português por valor de base da f0 ou linha de base da f0 é um conceito que não se
refere a excursões de articuladores (entendidos aqui como os articuladores supraglotais), mas sim de
excursões da f0 ou frequência fundamental da fala, que é o resultado acústico da vibração das pregas vocais.
Portanto, é uma excursão no espaço tonal e não no espaço articulatório propriamente dito.
Arantes (2017)19
, que examinaram auditiva e acusticamente amostras de fala com histogramas
de f0 semelhantes aos mostrados nas figuras 4 e 5 do Laudo e confirmaram que ocorrências
na cauda esquerda de uma amostra assimétrica de f0, que eventualmente conferem a essa
distribuição um caráter bimodal, são, em muitos casos, ocorrências de vozeamento crepitante.
O mesmo trabalho mostra, ainda, que em um corpus composto por amostras de fala
espontânea de sete línguas, entre elas o português brasileiro, uma porcentagem expressiva dos
falantes apresenta ocorrências de vozeamento não modal, entre eles voz crepitante. Entre os
falantes do português brasileiro, esse é o caso para 70% dos falantes. Resultados que vão
nessa mesma direção foram relatados em outros estudos que também analisaram o português
brasileiro (OLIVEIRA, 201720
, SOUSA, 201721
). A alta incidência de vozeamento não modal
na fala é típica não apenas no português, mas em uma quantidade expressiva de outras línguas
em que o fenômeno já foi estudado (ver revisão bibliográfica em Sousa 2016). Considerando
os fatos apresentados na literatura, é possível concluir que a simples presença de instâncias de
vozeamento não modal nas amostras padrão e questionada não tem um poder evidenciário
especialmente importante, uma vez que é um fenômeno prevalente na língua. Como corolário,
segue que o mesmo pode ser dito da semelhança na forma dos histogramas. Cabe notar que
Oliveira (2017) e Sousa (2017) mostram que há variabilidade entre falantes na taxa individual
de produção de vozeamento não modal, embora não se tenha demonstrado de maneira segura
se o grau de variabilidade intrafalante é efetivamente maior do que a variação entre diferentes
falantes, o que seria um requisito para o seu uso como parâmetro com bom poder
discriminador. De todo modo, o Laudo não apresenta valores de taxa de produção desses
eventos nas duas amostras em comparação, o que impede uma comparação dessa natureza.
6. Da conclusão
Os fundamentos da realização do exame de comparação de locutor são apresentados
na seção III.3 do Laudo. Um dos elementos relevantes constantes dessa seção é a sistemática
adotada para apresentação das conclusões do exame que resultam da consolidação do
conjunto dos exames realizados nas amostras submetidas a análise. No texto da mesma seção,
após discutir as dificuldades de adoção de uma escala quantitativa, justificada por limitações
que impedem que todos os exames tenham resultados quantitativos, declara-se o uso de uma
escala qualitativa, que é adotada por diversas instituições internacionais. Essa escala tem nove
pontos, que vão de -4 a +4, passando pelo zero. Os pontos devem expressar diferentes graus
de confirmação ou rejeição da hipótese de origem das duas amostras, a questionada e a
padrão. Comumente, essa hipótese assume que as duas amostras têm a mesma origem, isto é,
foram produzidas pelo mesmo falante. Assim, o nível -4 deveria ser usado quando as
evidências contradizem a hipótese de mesma origem muito fortemente; o nível +4 seria
reservado aos casos em que as evidências confirmam muito fortemente a hipótese de mesma
origem; finalmente, o nível 0 deve ser usado quando as evidências são inconclusivas, isto é,
19
TORIKAI, K. Avaliação do desempenho do algoritmo de extração da frequência fundamental da fala
do programa Praat. Trabalho de Conclusão de Curso—São Carlos: Universidade Federal de São Carlos,
2015.
20
SILVEIRA, I. J.; ARANTES, P. Efeitos do vozeamento não modal na descrição estatística de amostras
de frequência fundamental. Anais do Congresso Brasileiro de Prosódia da Fala. Anais... Em: IV
COLÓQUIO BRASILEIRO DE PROSÓDIA DA FALA. Mariana-MG: Associação Luso-Brasileira de
Ciências da Fala, 2017.
21
OLIVEIRA, J. C. C. Laringalização no português brasileiro: uma análise em torno do fenômeno
laríngeo e implicações para a comparação de locutor. Dissertação de mestrado—Maceió: Universidade
Federal de Alagoas, 2017.
quando não ajudam a confirmar ou rejeitar a hipótese em jogo. Os valores intermediários são
gradações nas duas direções.
Muito embora essa escala seja usada por muitas instituições, Eriksson, o mesmo autor
citado no Laudo quando justifica o seu uso, lembra que o uso de escalas qualitativas “dá
margem à subjetividade, em particular quando se pesa e combina os resultados da análise de
diversos parâmetros”22
(ERIKSSON, 2011, p. 60). Portanto, sem um protocolo explícito,
motivado e rigoroso que guie a relação entre os achados presentes no corpo evidenciário
reunido pelo exame pericial e atribuição de um nível numérico na escala, essa relação corre o
risco de ser estabelecida de maneira relativamente livre e subjetiva. Ressaltamos que já
existem propostas para relacionar de forma motivada e sistemática o resultado de análises de
variáveis linguísticas a graus em uma escala quantitativa como a sugerida por Eriksson
(2011). Uma proposta desse tipo é apresentada em Barbosa (2020).
Na seção IV do Laudo, o texto conclui que o conjunto dos exames apresentados na
seção III.4 corrobora fortemente a hipótese de mesma origem para as amostras padrão e
questionada, resultado que corresponde ao nível +3 na escala. Segundo o Laudo, a decisão
levou em conta “os graus de relevância e de recorrência das convergências encontradas nos
materiais analisados” (p. 9). Deve-se frisar que o texto do Laudo não explicita nem justifica
em nenhum momento o grau de relevância atribuído a cada exame apresentado na seção III.4,
tanto os de natureza perceptiva quanto acústica. Adiciona-se a isso a ausência de corroboração
empírica apresentada no corpo do texto do Laudo em especial para as afirmações constantes
na seção III.4.1. Finalmente, deve-se ainda chamar a atenção para a ausência de bases seguras
na literatura especializada que ajudem ponderar de maneira mais objetiva o poder indiciário
de alguns exames, em especial os reportados na seção III.4.1.
O que de mais seguro as afirmações presentes no Laudo permitem dizer é que ambos
os falantes são indivíduos do sexo masculino, falantes de alguma variedade linguística entre
as diversas faladas na “região sul”. Se tomarmos a população combinada dos três estados da
região sul conforme definida pelo IBGE, os falantes das amostras padrão e questionada são
dois falantes em um universo de aproximadamente 15 milhões de pessoas, considerando a
população conjunta dos três estados, divulgada na prévia do Censo Demográfico 202223
.
Levando em conta que as duas vozes fazem uso de um registro melódico relativamente mais
baixo do que a média da população, esse número pode ser reduzido para aproximadamente 5
milhões, conforme expus na seção 5 do presente parecer, o que, do ponto de vista da
possibilidade de um falso positivo na identificação, é inaceitavelmente alto.
Considerando todo o exposto anteriormente, avalio que o teor do que é apresentado no
Laudo não justifica a atribuição do nível +3 consignado pelo Laudo em sua seção IV.
Levando em conta todos os argumentos trazidos ao longo do presente parecer, meu melhor
juízo é que os resultados relatados no Laudo são mais compatíveis com a atribuição do nível 0
na escala adotada, que equivale à descrição verbal “o resultado nem corrobora nem contradiz
a hipótese”. A razão para essa conclusão são a inespecificidade e baixo poder
discriminatório das características linguísticas identificadas e analisadas no Laudo.
CONCLUSÃO: com base nas análises técnicas realizadas e na minha experiência
profissional como doutor na área de linguística, especialista na área de fonética, pesquisador
22
SOUSA, N. E. V. Laringalização e proeminências em fala espontânea - considerações sobre a estrutura
prosódica do português brasileiro. Trabalho de Conclusão de Curso—Brasília: Universidade de Brasília,
2017.
23
No original: “invites subjectivity, in particular when weighing and combining the results from analyses of
several parameters” (ERIKSSON, 2011, p. 60).
na área de fonética forense e autor de diversos artigos e outras publicações na área, afirmo que
o nível 0 seria o adequado para o caso, não se podendo corroborar, nem contradizer a hipótese
de mesma origem para as vozes.
É o nosso parecer, elaborado em 11 páginas, digitalmente assinado.
São Carlos, 5 de junho de 2023
PABLO ARANTES
Professor Adjunto
Laboratório de Fonética – Departamento de Letras
Universidade Federal de São Carlos

Weitere ähnliche Inhalte

Was ist angesagt?

19 aula transporte de produtos perigosos
19 aula transporte de produtos perigosos19 aula transporte de produtos perigosos
19 aula transporte de produtos perigososHomero Alves de Lima
 
AULA NR 37 MÓDULO BÁSICO
AULA NR 37 MÓDULO BÁSICOAULA NR 37 MÓDULO BÁSICO
AULA NR 37 MÓDULO BÁSICOPilar345603
 
Cintilografia ossea instrumentação
Cintilografia  ossea instrumentaçãoCintilografia  ossea instrumentação
Cintilografia ossea instrumentaçãoRodrigo Pina Almeida
 
Utilização do gadolínio em RM
Utilização do gadolínio em RM Utilização do gadolínio em RM
Utilização do gadolínio em RM Fabiano Ladislau
 
Transporte de produtos perigosos 2
Transporte de produtos perigosos 2Transporte de produtos perigosos 2
Transporte de produtos perigosos 2Jupira Silva
 
Trabalho de proteção radiologica n 1
Trabalho de proteção radiologica   n 1Trabalho de proteção radiologica   n 1
Trabalho de proteção radiologica n 1celinafc
 
Cintilografia: Medicina Nuclear - Conteúdo vinculado ao blog http://fisi...
Cintilografia: Medicina Nuclear - Conteúdo vinculado ao blog      http://fisi...Cintilografia: Medicina Nuclear - Conteúdo vinculado ao blog      http://fisi...
Cintilografia: Medicina Nuclear - Conteúdo vinculado ao blog http://fisi...Rodrigo Penna
 
Apresentação FAP - Fator Acidentário de Prevenção
Apresentação FAP - Fator Acidentário de Prevenção  Apresentação FAP - Fator Acidentário de Prevenção
Apresentação FAP - Fator Acidentário de Prevenção Mauricio Pallotta Rodrigues
 

Was ist angesagt? (9)

19 aula transporte de produtos perigosos
19 aula transporte de produtos perigosos19 aula transporte de produtos perigosos
19 aula transporte de produtos perigosos
 
AULA NR 37 MÓDULO BÁSICO
AULA NR 37 MÓDULO BÁSICOAULA NR 37 MÓDULO BÁSICO
AULA NR 37 MÓDULO BÁSICO
 
Cintilografia ossea instrumentação
Cintilografia  ossea instrumentaçãoCintilografia  ossea instrumentação
Cintilografia ossea instrumentação
 
Utilização do gadolínio em RM
Utilização do gadolínio em RM Utilização do gadolínio em RM
Utilização do gadolínio em RM
 
Como Funciona o Ultrassom
Como Funciona o UltrassomComo Funciona o Ultrassom
Como Funciona o Ultrassom
 
Transporte de produtos perigosos 2
Transporte de produtos perigosos 2Transporte de produtos perigosos 2
Transporte de produtos perigosos 2
 
Trabalho de proteção radiologica n 1
Trabalho de proteção radiologica   n 1Trabalho de proteção radiologica   n 1
Trabalho de proteção radiologica n 1
 
Cintilografia: Medicina Nuclear - Conteúdo vinculado ao blog http://fisi...
Cintilografia: Medicina Nuclear - Conteúdo vinculado ao blog      http://fisi...Cintilografia: Medicina Nuclear - Conteúdo vinculado ao blog      http://fisi...
Cintilografia: Medicina Nuclear - Conteúdo vinculado ao blog http://fisi...
 
Apresentação FAP - Fator Acidentário de Prevenção
Apresentação FAP - Fator Acidentário de Prevenção  Apresentação FAP - Fator Acidentário de Prevenção
Apresentação FAP - Fator Acidentário de Prevenção
 

Ähnlich wie Parecer técnico desmente voz de Eduardo Appio

Sintaxe definição e objeto
Sintaxe   definição e objetoSintaxe   definição e objeto
Sintaxe definição e objetoSérgio de Castro
 
Instrumento e grade de avaliação estudos sintáticos
Instrumento e grade de avaliação estudos sintáticosInstrumento e grade de avaliação estudos sintáticos
Instrumento e grade de avaliação estudos sintáticosclaudia murta
 
UFAL 2010 objetiva gabaritada
 UFAL 2010  objetiva gabaritada UFAL 2010  objetiva gabaritada
UFAL 2010 objetiva gabaritadacursohistoria
 
A SOCIOLINGUISTICA-1.pdf
A SOCIOLINGUISTICA-1.pdfA SOCIOLINGUISTICA-1.pdf
A SOCIOLINGUISTICA-1.pdfCINTYACARDOSO4
 
Tipos de variação linguística
Tipos de variação linguísticaTipos de variação linguística
Tipos de variação linguísticaNivea Neves
 
Plano de curso de espanhol E.M BNCC 2019
Plano de curso de espanhol  E.M  BNCC 2019Plano de curso de espanhol  E.M  BNCC 2019
Plano de curso de espanhol E.M BNCC 2019Vera Britto
 

Ähnlich wie Parecer técnico desmente voz de Eduardo Appio (11)

Sintaxe definição e objeto
Sintaxe   definição e objetoSintaxe   definição e objeto
Sintaxe definição e objeto
 
Instrumento e grade de avaliação estudos sintáticos
Instrumento e grade de avaliação estudos sintáticosInstrumento e grade de avaliação estudos sintáticos
Instrumento e grade de avaliação estudos sintáticos
 
Artigo sobre sociolinguistica
Artigo sobre sociolinguisticaArtigo sobre sociolinguistica
Artigo sobre sociolinguistica
 
Prova primeiro ano
Prova   primeiro anoProva   primeiro ano
Prova primeiro ano
 
UFAL 2010 objetiva gabaritada
 UFAL 2010  objetiva gabaritada UFAL 2010  objetiva gabaritada
UFAL 2010 objetiva gabaritada
 
Termos Essenciais Sujeito
Termos Essenciais SujeitoTermos Essenciais Sujeito
Termos Essenciais Sujeito
 
A SOCIOLINGUISTICA-1.pdf
A SOCIOLINGUISTICA-1.pdfA SOCIOLINGUISTICA-1.pdf
A SOCIOLINGUISTICA-1.pdf
 
Manual de Padronização de Texto do STJ
Manual de Padronização de Texto do STJManual de Padronização de Texto do STJ
Manual de Padronização de Texto do STJ
 
Tipos de variação linguística
Tipos de variação linguísticaTipos de variação linguística
Tipos de variação linguística
 
Plano de curso de espanhol E.M BNCC 2019
Plano de curso de espanhol  E.M  BNCC 2019Plano de curso de espanhol  E.M  BNCC 2019
Plano de curso de espanhol E.M BNCC 2019
 
Semântica.PDF
Semântica.PDFSemântica.PDF
Semântica.PDF
 

Mehr von Aquiles Lins

Pesquisa-prefeitura-SP
Pesquisa-prefeitura-SPPesquisa-prefeitura-SP
Pesquisa-prefeitura-SPAquiles Lins
 
Acórdão Final - TCU
Acórdão Final - TCUAcórdão Final - TCU
Acórdão Final - TCUAquiles Lins
 
Estudo BNDES e Mercado
Estudo BNDES e Mercado Estudo BNDES e Mercado
Estudo BNDES e Mercado Aquiles Lins
 
Convocação Wellington Macedo
Convocação Wellington MacedoConvocação Wellington Macedo
Convocação Wellington MacedoAquiles Lins
 
Sentença (2).pdf
Sentença (2).pdfSentença (2).pdf
Sentença (2).pdfAquiles Lins
 
Pesquisa Febraban-Ipespe
Pesquisa Febraban-IpespePesquisa Febraban-Ipespe
Pesquisa Febraban-IpespeAquiles Lins
 
Decisão ministro Cristiano Zanin
Decisão ministro Cristiano Zanin Decisão ministro Cristiano Zanin
Decisão ministro Cristiano Zanin Aquiles Lins
 
Relatório - subsecretaria - Rogerio Correia - Anderson Torres.pdf
Relatório - subsecretaria - Rogerio Correia - Anderson Torres.pdfRelatório - subsecretaria - Rogerio Correia - Anderson Torres.pdf
Relatório - subsecretaria - Rogerio Correia - Anderson Torres.pdfAquiles Lins
 
Despacho Toffoli Tony Garcia
Despacho Toffoli Tony Garcia Despacho Toffoli Tony Garcia
Despacho Toffoli Tony Garcia Aquiles Lins
 
Sinprev contesta Deyvid Bacelar
Sinprev contesta Deyvid Bacelar Sinprev contesta Deyvid Bacelar
Sinprev contesta Deyvid Bacelar Aquiles Lins
 
Novo relatório da Reforma Tributária
Novo relatório da Reforma Tributária Novo relatório da Reforma Tributária
Novo relatório da Reforma Tributária Aquiles Lins
 
Ação cautelar MP-PI contra prefeito de Barro Duro
Ação cautelar MP-PI contra prefeito de Barro DuroAção cautelar MP-PI contra prefeito de Barro Duro
Ação cautelar MP-PI contra prefeito de Barro DuroAquiles Lins
 
Lindbergh pede a demissão de Campos Neto
Lindbergh pede a demissão de Campos NetoLindbergh pede a demissão de Campos Neto
Lindbergh pede a demissão de Campos NetoAquiles Lins
 
Análise da PF material encontrado com Marco do Val
Análise da PF material encontrado com Marco do ValAnálise da PF material encontrado com Marco do Val
Análise da PF material encontrado com Marco do ValAquiles Lins
 
Minuta_ Decisão Liminar - RCL 60201Assinado (1).pdf
Minuta_ Decisão Liminar - RCL 60201Assinado (1).pdfMinuta_ Decisão Liminar - RCL 60201Assinado (1).pdf
Minuta_ Decisão Liminar - RCL 60201Assinado (1).pdfAquiles Lins
 
Representação Rombo da Caixa - TCU - final.pdf
Representação Rombo da Caixa - TCU - final.pdfRepresentação Rombo da Caixa - TCU - final.pdf
Representação Rombo da Caixa - TCU - final.pdfAquiles Lins
 
Painel-CAMINHONEIROS
Painel-CAMINHONEIROSPainel-CAMINHONEIROS
Painel-CAMINHONEIROSAquiles Lins
 
Moraes liberta Anderson Torres
Moraes liberta Anderson TorresMoraes liberta Anderson Torres
Moraes liberta Anderson TorresAquiles Lins
 
Decisão Operação Venire
Decisão Operação Venire Decisão Operação Venire
Decisão Operação Venire Aquiles Lins
 
Agrishow cancela abertura
Agrishow cancela abertura Agrishow cancela abertura
Agrishow cancela abertura Aquiles Lins
 

Mehr von Aquiles Lins (20)

Pesquisa-prefeitura-SP
Pesquisa-prefeitura-SPPesquisa-prefeitura-SP
Pesquisa-prefeitura-SP
 
Acórdão Final - TCU
Acórdão Final - TCUAcórdão Final - TCU
Acórdão Final - TCU
 
Estudo BNDES e Mercado
Estudo BNDES e Mercado Estudo BNDES e Mercado
Estudo BNDES e Mercado
 
Convocação Wellington Macedo
Convocação Wellington MacedoConvocação Wellington Macedo
Convocação Wellington Macedo
 
Sentença (2).pdf
Sentença (2).pdfSentença (2).pdf
Sentença (2).pdf
 
Pesquisa Febraban-Ipespe
Pesquisa Febraban-IpespePesquisa Febraban-Ipespe
Pesquisa Febraban-Ipespe
 
Decisão ministro Cristiano Zanin
Decisão ministro Cristiano Zanin Decisão ministro Cristiano Zanin
Decisão ministro Cristiano Zanin
 
Relatório - subsecretaria - Rogerio Correia - Anderson Torres.pdf
Relatório - subsecretaria - Rogerio Correia - Anderson Torres.pdfRelatório - subsecretaria - Rogerio Correia - Anderson Torres.pdf
Relatório - subsecretaria - Rogerio Correia - Anderson Torres.pdf
 
Despacho Toffoli Tony Garcia
Despacho Toffoli Tony Garcia Despacho Toffoli Tony Garcia
Despacho Toffoli Tony Garcia
 
Sinprev contesta Deyvid Bacelar
Sinprev contesta Deyvid Bacelar Sinprev contesta Deyvid Bacelar
Sinprev contesta Deyvid Bacelar
 
Novo relatório da Reforma Tributária
Novo relatório da Reforma Tributária Novo relatório da Reforma Tributária
Novo relatório da Reforma Tributária
 
Ação cautelar MP-PI contra prefeito de Barro Duro
Ação cautelar MP-PI contra prefeito de Barro DuroAção cautelar MP-PI contra prefeito de Barro Duro
Ação cautelar MP-PI contra prefeito de Barro Duro
 
Lindbergh pede a demissão de Campos Neto
Lindbergh pede a demissão de Campos NetoLindbergh pede a demissão de Campos Neto
Lindbergh pede a demissão de Campos Neto
 
Análise da PF material encontrado com Marco do Val
Análise da PF material encontrado com Marco do ValAnálise da PF material encontrado com Marco do Val
Análise da PF material encontrado com Marco do Val
 
Minuta_ Decisão Liminar - RCL 60201Assinado (1).pdf
Minuta_ Decisão Liminar - RCL 60201Assinado (1).pdfMinuta_ Decisão Liminar - RCL 60201Assinado (1).pdf
Minuta_ Decisão Liminar - RCL 60201Assinado (1).pdf
 
Representação Rombo da Caixa - TCU - final.pdf
Representação Rombo da Caixa - TCU - final.pdfRepresentação Rombo da Caixa - TCU - final.pdf
Representação Rombo da Caixa - TCU - final.pdf
 
Painel-CAMINHONEIROS
Painel-CAMINHONEIROSPainel-CAMINHONEIROS
Painel-CAMINHONEIROS
 
Moraes liberta Anderson Torres
Moraes liberta Anderson TorresMoraes liberta Anderson Torres
Moraes liberta Anderson Torres
 
Decisão Operação Venire
Decisão Operação Venire Decisão Operação Venire
Decisão Operação Venire
 
Agrishow cancela abertura
Agrishow cancela abertura Agrishow cancela abertura
Agrishow cancela abertura
 

Parecer técnico desmente voz de Eduardo Appio

  • 1. PARECER TÉCNICO SOBRE O LAUDO Nº 710/2023 – SETEC/SR/PF/RS Na condição de professor universitário de linguística, coordenador do Laboratório de Fonética da Universidade Federal de São Carlos e pesquisador na área de fonética forense há pelo menos dez anos, fui, em função da minha especialidade acadêmica, solicitado pelo escritório do Doutor Pedro Serrano, Walfrido Warde e Rafael Valim advogados associados, os quais representam o Juiz Federal Eduardo Appio, a realizar análise técnica e parecer a respeito do Laudo de Perícia Criminal Federal nº 710/2023, emitido pelo Setor Técnico-Científico da Superintendência Regional de Polícia Federal no Rio Grande do Sul (SETEC/SR/PF/RS), ao qual passarei a me referir como Laudo no restante deste documento. 1. Dos objetivos O presente parecer técnico tem como objetivo analisar os fundamentos, procedimentos técnicos e as conclusões apresentadas no referido Laudo. Usarei para tanto meus conhecimentos técnicos nas áreas da linguística, especialmente da fonética e minha experiência como pesquisador na área da fonética forense. Tomarei como referência para a análise dos fundamentos e procedimentos técnicos empregados na tarefa de comparação de vozes em contexto forense a literatura especializada na área, que será citada quando pertinente, e o protocolo de análise fonético-forense para comparação de locutor sistematizado e apresentado em Barbosa et al. (2020)1 . 2. Do material analisado e do propósito do Laudo Para emitir o presente parecer, foram disponibilizadas as mesmas gravações analisadas pelo Laudo. Os detalhes técnicos do material padrão e do material questionado são muito bem descritos no Laudo e não irei repeti-los aqui. Registro apenas que as somas de verificação de tipo SHA-256 e a duração das duas amostras coincidem exatamente com as reportadas no Laudo nas tabelas 1 e 2 (pp. 1-2). No que segue, descrevo a situação de interação verbal que caracteriza as duas amostras, por ser informação relevante para considerações que serão feitas posteriormente no presente parecer. O material padrão é uma Audiência de Custódia registrada em vídeo, na qual os interactantes estão em copresença: parte está no mesmo ambiente físico e outros participam por meio de videoconferência e todos podem se ouvir e ver-se mutuamente durante a interação. A voz do Juiz e Presidente da Audiência de Custódia é considerada a voz padrão. Na amostra questionada, há duas pessoas que falam. A voz cuja identidade interessa estabelecer vem de uma chamada feita para um aparelho celular por meio do aplicativo de chamadas VOIP Skype. A pessoa que recebe a ligação ouve a chamada em viva voz. A interação é registrada em formato de vídeo, gravado por meio de outro aparelho celular por um terceiro participante, que está próximo à pessoa que segura o celular que está recebendo a ligação. Dadas as características técnicas e conversacionais das amostras padrão e questionada, é relevante notar que duas condições de incongruência se verificam: a de condição técnica de gravação e uma incongruência de estilo de elocução. A primeira está relacionada ao fato da gravação da voz do falante de interesse na amostra padrão ter sido uma gravação direta em 1 BARBOSA, P. A. et al. (EDS.). Análise fonético-forense em tarefa de comparação de locutor. 1. ed. Campinas: Millenium Editora, 2020.
  • 2. microfone de qualidade e a amostra questionada resultar de uma transmissão sujeita a filtagem e compressões, que resultam em perda de qualidade do sinal acústico. A principal limitação imposta por essa incongruência é a limitação em relação ao tipo de exame que pode ser feito. Seria importante que o Laudo tivesse mencionado esse fato na seção III.2, que discute a adequabilidade das amostras. A respeito da incongruência estilística, faço comentários mais detalhados na seção 5 do presente parecer. O objetivo estabelecido para o Laudo é testar a hipótese segundo a qual a voz padrão e a voz questionada têm a mesma origem, isto é, que a voz do Juiz e Presidente da Audiência de Custódia registrada no material padrão é a mesma que fala na chamada feita ao portador do celular no vídeo que compõe o material questionado. A título de perfil sociodemográfico, cabe informar que o falante de interesse na amostra padrão é um indivíduo do sexo masculino, com 53 anos completos, com ensino superior completo, com atuação na área jurídica. Nasceu em uma cidade do interior do estado do Rio Grande do Sul, residiu por 10 anos em Porto Alegre e posteriormente passou a viver no estado do Paraná, a maior parte do tempo na cidade de Curitiba. O que se pode depreender dessas informações é que o falante passou a maior parte da sua vida em idade produtiva longe de sua cidade e estado natais, de modo que se pode esperar que as características de sua fala provavelmente não são as típicas de alguém nascido no mesmo estado e cidade. Além disso, pode-se esperar que sua fala apresente as características de alguém que viveu a maior parte da sua vida em ambiente urbano e com alto grau de escolarização. 3. Da adequabilidade dos materiais As duas amostras são declaradas “adequadas para a realização do exame de Comparação de Locutor” no Laudo. Os critérios usados para fundamentar essa declaração não são apresentados explicitamente no Laudo, nem se aponta, por meio de citação bibliográfica, material de consulta que fundamente a decisão. Em especial, não se faz nenhuma consideração em relação às diferenças de qualidade técnica e à incongruência estilística que existem entre as duas amostras e as consequências disso para a realização de diferentes exames nos materiais, como apontei na seção anterior do presente parecer. 4. Das análises apresentadas A seção III.4.1 do Laudo apresenta o que chama de “características linguísticas de cunho perceptual” encontradas no material questionado e no material padrão e faz considerações de natureza comparativa entre essas observações. Os resultados da comparação entre essas características aparecem na forma de uma lista de oito itens. No que segue, replico na integralidade cada um dos oito itens (destacados em itálico), cujo conteúdo analiso individualmente. a) As vozes padrão e questionada apresentam características de indivíduos adultos e do sexo masculino; A inferência a respeito do sexo do falante da amostra questionada não é problemática, mesmo dada a baixa qualidade técnica da gravação. O mesmo vale para o falante na gravação padrão. O registro melódico grave e timbre vocal empregado por ambos, ambas informações depreensíveis pela audição das amostras, dão fundamento para essa firmação.
  • 3. b) Os dois locutores apresentam repertório verbal e sotaque compatível com falantes da região sul do Brasil; Em relação a esse item, a primeira consideração a fazer é que, do ponto de vista das divisões dialetológicas do Brasil, o que se chama de “região sul” é um espaço geográfico muito amplo, que compreende mais territórios além do três estados da federação que compõem a região sul na divisão usada pelo IBGE (Paraná, Santa Catarina e Rio Grande do Sul). Historicamente, o que a tradição dialetológica brasileira chama de “região sul” engloba áreas que avançam, na direção setentrional, até o sul dos estados de Goiás e Mato Grosso (SANTOS, 2020)2 . Mesmo se tomados apenas os três estados da região sul definida pelo IBGE, cada estado apresenta variações linguísticas relevantes em níveis de análise linguística diversos, como, por exemplo, a fonética, a fonologia, a morfossintaxe e o léxico. Se consideradas apenas a variação ao nível do léxico e de alguns fenômenos fonético- fonológicos, mesmo um estado tomado individualmente pode ser subdividido em diferentes zonas lexicais, como se pode ver em Romano (2018)3 e Chofard e Margottti (2019)4 . Portanto, a afirmação de compatibilidade entre os locutores com relação à região dialetal careceria de maior especificação para que essa observação pudesse contribuir de forma importante como elemento para a comparação entre os locutores. A respeito de “repertório verbal”, não está claro o que o Laudo entende por essa expressão e que manifestações linguísticas ela recobre. Se entendermos essa expressão no sentido mais limitado de seleção vocabular, isto é, a escolha das palavras usadas por um falante em sua produção verbal, o exame do vocabulário empregado pela Voz 1 na amostra questionada mostra não haver nenhum item que chame particularmente a atenção por seu caráter regional5 , em particular aquelas que são comumente associadas às variedades linguísticas faladas nos estados da região sul do país. Nesse sentido, consultar as cartas geolinguísticas Romano (2018) e Chofard e Margottti (2019) para consultar as variantes lexicais prevalentes nos chamados “falares do sul”. O Laudo, no entanto, não especifica quais itens lexicais presentes nas amostras questionada e padrão seriam evidência do pertencimento de ambos os falantes à zona dialetal sulista, mesmo que ela não seja delimitada no texto nem espacialmente, nem em suas dimensões linguísticas. No que diz respeito a “sotaque”, esse é um termo do jargão linguístico para fazer referência ao modo de pronunciar uma língua que é típico de uma determinada comunidade de fala (TRASK, 2004)6 . Faz referência sobretudo a aspectos da pronúncia de segmentos fonéticos individuais, mas pode englobar também aspectos da organização melódica e rítmica da fala (BARBOSA, 2019)7 . Nesse sentido, o Laudo não arrola nenhuma literatura para caracterizar do ponto de vista fonético-fonológico o sotaque ou os sotaques típicos dos falares 2 BARBOSA, P. A. et al. (EDS.). Análise fonético-forense em tarefa de comparação de locutor. 1. ed. Campinas: Millenium Editora, 2020. 3 SANTOS, L. A. DOS. Pelos caminhos das áreas dialetais e lexicais do Brasil. Caletroscópio, v. 8, n. 2, p. 44–62, 2020. 4 ROMANO, V. P. Áreas lexicais no Centro-Sul do Brasil sob uma perspectiva geolinguística. Revista de Estudos da Linguagem, v. 26, n. 1, p. 103–145, 2018. 5 CHOFARD, A.; MARGOTTI, F. W. O português falado no Sul do Brasil: um balanço das áreas dialetais a partir de itens lexicais do ALiB. Polifonia, v. 26, p. 296–316, 2019. 6 Uma vez que o Laudo não traz a transcrição ortográfica do diálogo que constitui a amostra questionada, considerei, para essa análise, a transcrição do teor da gravação questionada referida no Laudo, que consta das páginas 14 e 15 do documento SEI 6595089 do processo SEI 0003142-16.2023.4.04.8000; doc. 6642989. 7 TRASK, R. L. Dicionário de linguagem e linguística. 1. ed. São Paulo: Contexto, 2004.
  • 4. da região sul nem apresenta dados extraídos das duas amostras que pudessem servir para caracterizar minimamente na dimensão fonético-fonológico as falas presentes nas duas amostras. A falta de critérios objetivos para definir as duas dimensões linguísticas mencionadas nesse item, combinada à ausência de qualquer dado extraído das amostras enfraquece bastante o peso evidencial dessa observação. c) Convergência prosódica, ou seja, entonação, ritmo, acento (intensidade, altura, duração) compatíveis entre material padrão e questionado; Ritmo e entoação são manifestações de fenômenos linguísticos de ordem fonética e fonológica que dizem respeito a variações observáveis apenas quando se considera enunciados como um todo e não apenas fones individuais e são, por isso, chamados também de fenômenos suprassegmentais (LEHISTE, 1970)8 . Mais especificamente, entoação diz respeito a modulações na curva de frequência fundamental da fala (abreviada por f0 no restante do texto) ou curva melódica, responsáveis por gerar, ao longo de um enunciado, de pontos graves ou agudos. Esses padrões de regiões graves e agudas podem ter funções linguísticas (nesse caso, são chamados tons) ou paralinguísticas, como a expressão de atitudes (ironia, surpresa e desconfiança, por exemplo), e de estados emocionais (DE MORAES; RILLIARD, 2014)9 . No que diz respeito ao seu uso para caracterizar a fala, ritmo pode ser entendido como a sensação perceptual resultante da integração entre duas tendências distintas, a regularidade na enunciação das sílabas e a alternância entre sílabas proeminentes e não proeminentes (BARBOSA, 2019). Ambos são fenômenos muito complexos de analisar e caracterizar, dado que se manifestam por meio de diferentes correlatos acústicos e perceptuais. Para a entoação, o principal correlato físico é a f0 e o alinhamento entre modulações no contorno de f0 e elementos pontuais na cadeia da fala. Para a análise e caracterização do ritmo, parâmetros acústicos relevantes são alongamentos de unidades como a sílaba em certas posições, pausas e a modulação geral da duração ao longo do enunciado, além da variação da intensidade e do esforço vocal (BARBOSA, 2019). Tanto a entoação quanto o ritmo são fenômenos sujeitos a variação em função de região geográfica, estilo de elocução e escolhas estilísticas individuais. Em função dessa multiplicidade de determinantes, a caracterização do ritmo e da entoação de um falante e sua comparação com os padrões de outros falantes não é simples de ser feita e a mera apreciação auditiva sem o uso de conceitos e metalinguagem apropriada é insuficiente para uma descrição adequada dos padrões entoacionais e rítmicos presentes nas amostras. Neste item, o Laudo menciona alguns parâmetros acústicos – intensidade, altura e duração –, sugerindo que teriam sido analisados. Não há, no entanto, não se diz se são tomados ali em sua face perceptual ou como parâmetros acústicos analisados por meio instrumental. Além disso, o Laudo não menciona nenhum dado ou análise concreta, qualitativa ou quantitativa, feita a partir da observação dos três parâmetros mencionados. Finalmente, não há menção a qualquer critério que teria sido utilizado para estabelecer o que o Laudo caracteriza como “convergência”. É relevante a essa altura mencionar a questão de como a literatura trata do uso de parâmetros entoacionais e rítmicos especificamente em tarefas de comparação entre vozes em contexto forense. Há um número limitado de trabalhos que tratam especificamente desse tema 8 BARBOSA, P. A. Prosódia. 1. ed. São Paulo: Parábola, 2019. 9 LEHISTE, I. Suprasegmentals. Cambridge, MA: MIT Press, 1970.
  • 5. (HE; DELLWO, 201610 ; NOLAN, 200211 ) e não há, até o presente momento, protocolos de análise aceitos consensualmente. Em especial, nenhum trabalho acadêmico recomenda que análises desse tipo sejam feitas de forma puramente perceptual, sem o apoio de uma metalinguagem específica e com o cotejo de diferentes parâmetros acústicos extraídos das amostras de áudio a serem comparadas. d) Compatibilidade de taxa de elocução entre questionado e padrão; Taxa de elocução é uma expressão que faz referência a um índice que mede o número de ocorrências de determinada unidade linguística (que em geral é a palavra ou a sílaba) por unidade de tempo, em geral minutos quando a unidade linguística é a palavra, ou segundos, quando é a sílaba. Valores maiores indicam uma fala mais rápida e valores menores, uma fala mais lenta. Há diferentes maneiras de implementar esse índice e esta escolhas podem afetar sua relevância para uma determinada tarefa. A chamada taxa de elocução inclui na duração das unidades linguísticas as pausas silenciosas que podem acompanhar as sílabas em pontos proeminentes no enunciado. Quando essas pausas são excluídas do cômputo, o índice é chamado de taxa de articulação. A literatura especializada em fonética forense sugere que a taxa de articulação é um índice com maior poder discriminador do que a taxa de elocução. Isso acontece porque o número e a duração das pausas em um enunciado dependem de muitos fatores, desde os propriamente linguísticos como a estrutura sintática dos enunciados até fatores como o estilo de elocução (se estamos falando de forma espontânea ou lendo, ou em situações em que a fala é planejada com antecedência ou elaborada em tempo real). Por isso, considera-se que a taxa de articulação reflita melhor padrões motores possivelmente idiossincráticos e resistentes tanto a variações na situação comunicacional e até mesmo a tentativas de disfarce vocal (ERIKSSON, 2011)12 . Quanto ao poder discriminador da taxa de articulação em situação de comparação de vozes, a literatura aponta que ele é moderado (OLIVEIRA, 2021)13 . No Laudo, afirma-se que a taxa de elocução foi analisada, escolha que já mereceria uma justificativa, uma vez que a taxa de articulação seria uma escolha mais apropriada. Segundo, não se explicita o método usado para o cálculo da taxa de elocução, isto é, se a unidade linguística escolhida foi palavra, sílaba ou fone, por exemplo. Não se mencionam os valores da taxa calculada para as amostras questionada e padrão. Não é possível saber, por exemplo, se a ausência dessas informações indica que se recorreu a uma estimativa perceptual da taxa. Terceiro, o Laudo afirma que há “compatibilidade” entre as taxas de elocução das amostras questionada e padrão, embora não seja possível inferir o critério usado para estabelecer essa semelhança. A falta dos valores específicos estimados a partir das duas amostras impede que se julgue a relevância da similaridade entre amostra questionada e padrão, além de impedir que se estabeleça a prevalência dos valores observados no contexto 10 DE MORAES, J. A.; RILLIARD, A. Illocution, attitudes and prosody: A multimodal analysis. Em: RASO, T.; MELLO, H. (Eds.). Studies in Corpus Linguistics. Amsterdam: John Benjamins Publishing Company, 2014. v. 61p. 233–270. 11 HE, L.; DELLWO, V. The role of syllable intensity in between-speaker rhythmic variability. International Journal of Speech Language and the Law, v. 23, n. 2, p. 243–273, 21 nov. 2016. 12 NOLAN, F. Intonation in speaker identification: an experiment on pitch alignment features. Forensic Linguistics, v. 9, n. 1, p. 3–21, 2002. 13 ERIKSSON, A. Aural/acoustic vs. automatic methods in forensic phonetic case work. Em: NEUSTEIN, A.; PATIL, H. A. (Eds.). Forensic Speaker Recognition: Law Enforcement and Counter-terrorism. [s.l.] Springer, 2011. p. 41–70.
  • 6. de uma população relevante. Deste modo, a evidência relatada nesse item não pode ter peso relevante a favor ou contra a hipótese de que as amostras têm a mesma origem. f) Os locutores possuem voz grave, com a presença de trechos de laringalização (creaky voice/vocal fry); A afirmação de que os locutores nas duas amostras têm voz relativamente grave não é de todo problemática. O exame perceptual das duas amostras sugere que o registro tonal e o timbre vocal nas duas poderia ser classificado como relativamente graves. Nesse aspecto, há semelhança entre as duas. Podemos observar que o valor mais típico (ou a moda) de f0 é de 110 Hz nas duas amostras, informação que pode ser observada nas figuras 4 e 5 do Laudo. Tomando os valores de estatística populacional de f0 para o português brasileiro reportados em Cunha (2023)14 , é possível ver que a moda de f0 na população masculina brasileira é de aproximadamente 122 Hz e seu desvio-padrão é de aproximadamente 22 Hz. Do ponto de vista da tipicidade, pode-se notar que embora as duas vozes sejam semelhantes nesse quesito, o nível típico de f0 das duas, que está em torno de 12 Hz abaixo da moda populacional, não é especialmente atípico, dado o desvio-padrão típico na população, que é de 22 Hz. Isso significa que uma quantidade alta de falantes além daquele cuja voz aparece na amostra padrão poderia ter uma moda de f0 igual ou muito próxima à do falante da gravação questionada. Portanto, o valor discriminador da observação relatada nesse item é de baixo peso. No que diz respeito à presença de trechos com laringalização, a seção 5 do presente parecer traz uma apreciação mais detalhada da relevância desse achado em conjunto com os comentários a respeito dos resultados da análise acústica do parâmetro f0 trazidos pelo Laudo. g) Aspirações recorrentes em ambos materiais; Não está claro o que se quer dizer com “aspiração” no contexto do Laudo. O termo, na literatura fonética, faz referência ao fenômeno do atraso do vozeamento de vogal que segue uma consoante plosiva, de modo a formar uma fricativa glotal entre a soltura da oclusão e o início do vozeamento da vogal seguinte. Não está claro se o termo está sendo usado no Laudo nessa acepção estrita ou se em um sentido mais amplo para fazer referência genericamente a fenômenos como a presença de ruído audível de inspiração e expiração. Em qualquer dos casos, para que essa observação tenha algum peso evidencial faltam: 1) uma caracterização fonética mínima do fenômeno; 2) apresentação de exemplos relevantes extraídos das duas amostras em exame que mostrasse padrões semelhantes do fenômeno nas duas amostras em exame; 3) uma estimativa precisa da taxa de ocorrência dos fenômenos nas duas amostras, de modo que o adjetivo “recorrentes” faça algum sentido e 4) menção de dados de prevalência do fenômeno na população de interesse. A reunião desses fatores impede julgar adequadamente o valor evidencial dessa observação, dado seu caráter genérico. h) Observados registros semelhantes a leve disfluência nos materiais questionados e padrão com a presença de bloqueios, repetições de palavras e prolongamentos de sons; 14 OLIVEIRA, J. C. C. Multiparametric analysis of phonetic-acoustic measures in genetically and non- genetically related speakers: implications for forensic speaker comparison. Tese de doutorado— Campinas: Universidade Estadual de Campinas, 2021.
  • 7. Em relação às ocorrência de disfluência, nenhum exemplo concreto dos tipos de disfluência citados no Laudo – “bloqueios, repetições de palavras e prolongamento de sons” – é apresentado que pudesse servir para sugerir um padrão semelhante e idiossincrático de ocorrência nas duas amostas. Não se apresenta nenhum quantificação a respeito da prevalência dos diferentes tipos de hesitação nas duas amostras que pudesse também sugerir padrões recorrentes. Portanto, do ponto de vista da semelhança entre amostra padrão e questionada a observação é simplesmente declaratória e não é possível avaliar sua propriedade. Do ponto de vista da tipicidade, a literatura da área de fonética forense carece de padrões estabelecidos a respeito do poder dos eventos de disfluência como variável identificadora de falante. Um dos complicadores dessa tarefa é que eventos de disfluência “fazem parte das produções faladas de todos [ênfase da autora] os locutores, tenham eles distúrbios de comunicação ou não” (MERLO, 2006, p. 20)15 . Desse modo, na falta de estudos estabelecidos a respeito do tema, a atitude mais prudente é considerar que apenas ocorrências patentemente idiossincráticas de disfluências sejam levadas em conta como indicador de identidade de falante. No caso do Laudo, como não há nenhuma evidência que aponte firmemente para um padrão idiossincrático que se manifestasse nas duas amostras, pode-se dizer que o valor evidencial da declaração presente nesse item do Laudo é baixo. 5. Da análise acústica No situação analisada no Laudo, a gravação da amostra questionada é uma conversa telefônica (os dois interlocutores envolvidos não estão à vista um do outro) e a amostra padrão é uma conversa na qual os interactantes estão em copresença: parte está no mesmo ambiente físico e outros participam por meio de videoconferência e todos podem se ouvir e ver-se mutuamente durante a interação. Essa situação cria duas condições de incongruência: condição técnica de gravação (gravação direta em microfone versus transmissão telefônica/telemática) e estilo de elocução (conversação face a face versus conversação telefônica). A respeito do chamado “efeito telefônico”, a literatura aponta um aumento em torno de 5 Hz para a fala telefônica em comparação à fala gravada em interação face a face. O aumento é de 7 Hz na f0 mediana no caso do português brasileiro (PASSETTI, 2018, p. 58)16 , que é compatível com valores observados em outras línguas. O Laudo reporta os valores 98,77 Hz e 95,88 Hz para o valor de base17 das amostras questionada e padrão, respectivamente. Considerando que a extração dos valores de f0 da amostra questionada não foi afetada por uma quantidade elevada de erros causados pela baixa qualidade do áudio, a similaridade entre as amostras é alta. Ainda assim, é possível imaginar que a pequena diferença encontrada nos valores encontrados pode ser de fato maior em função tanto da incongruência técnica quanto estilística a que nos referimos anteriormente. Para estabelecer a tipicidade desses valores, podemos tomá-los em relação à distribuição populacional do valor de base na população brasileira do sexo masculino. Os 15 CUNHA, M. S. DA. Estatísticas populacionais da frequência fundamental do português brasileiro para uso em fonética forense. Dissertação de Mestrado—São Carlos: Universidade Federal de São Carlos, 2023. 16 MERLO, S. Hesitações na fala semi-espontânea: analise por séries temporais. Dissertação de Mestrado— Campinas: Universidade Estadual de Campinas, 2006. 17 PASSETTI, R. R. Estudo acústico-perceptual do estilo de fala telefônico com implicações para a verificação de locutor em português brasileiro. Tese de doutorado—Campinas: Universidade Estadual de Campinas, 2018.
  • 8. valores para a média e desvio-padrão da distribuição populacional do valor de base, obtido em Cunha (2023) são, respectivamente, 106,3 Hz e 18 Hz. Assumindo que essa população seja bem descrita por uma distribuição de probabilidade normal ou gaussiana, é possível estimar que aproximadamente 33,8% da população brasileira tenha um valor de base igual ou menor ao que foi observado na amostra questionada, incluído aí o falante da amostra padrão. Essa alta porcentagem de falantes com um valor de base igual ou menor ao observado na amostra questionada significa que assumir, com base na proximidade entre os valores reportados no Laudo, que o falante da amostra questionada é também o produtor da amostra questionada tem uma alta probabilidade de gerar um falso positivo na identificação, o que seria extremamente indesejável. Portanto, o possível peso que a alta similaridade nesse parâmetro poderia exercer em favor de uma hipótese de mesma origem para amostra questionada e padrão é bastante atenuado pela alta tipicidade de ambos os valores na população relevante. Ainda na seção III.4.2 do Laudo, são apresentados os histogramas das distribuições de f0 das amostras questionada e padrão (figuras 4 e 5). Os histogramas agrupam os valores da amostra em intervalos de classe de 10 Hz e mostram valores que vão de 50 a 200 Hz. O Laudo afirma haver alta compatibilidade entre os histogramas, baseado no fato de que o intervalo de classe modal de ambos é 110 Hz, embora não deixe claro se houve aplicação de algum outro procedimento além do exame visual. Nos dois histogramas pode-se ver a ocorrência de uma cauda à esquerda do valor modal, com valores concentrados entre 80 e 50 Hz. Dados os valores modais de f0 das duas distribuições, essa concentração relativa de ocorrências de f0 quase uma oitava abaixo da moda amostral é compatível com instâncias de vozeamento não modal, em particular voz crepitante ou laringalizada. Essa observação acústica corrobora o item (f) da seção III.4.1 do Laudo, que aponta a presença de eventos de vozeamento laringalizado em ambas as amostras. A esse respeito, uma questão técnica precisa ser levantada. Embora relativamente robustos, o algoritmos de extração da frequência fundamental estão sujeitos a erros de estimação, que aumentam conforme piora a qualidade da gravação (TORIKAI, 2015)18 . Um dos erros mais comuns é o chamado “erro de oitava”, que consiste na estimação errônea da f0 em uma determinada janela de análise, de modo que o valor retornado é o dobro ou metade do que o correto. Considerando, especialmente no caso da amostra questionada, que as ocorrências de f0 da cauda esquerda têm valores que são próximos à metade dos valores de f0 mais típicos da amostra, há o risco de que as ocorrências vistas naquela cauda possam, pelo menos em parte, ter resultado de erros de oitava na extração. O Laudo não traz considerações mais detalhadas acerca dos procedimentos empregados na extração da f0 nas amostras, de modo que não se sabe se houve uma verificação manual dos valores obtidos pela extração automática, que parece ter sido feita por intermédio do programa de análise acústica Praat. Partindo da assunção de que todos os valores presentes em ambos os histogramas estejam livres de erros de extração, cabe discutir a tipicidade da semelhança entre os histogramas das amostras questionada e padrão. Como dito no parágrafo anterior, é possível associar a cauda esquerda naqueles histogramas à presença de eventos de vozeamento não modal, em especial voz crepitante. Essa hipótese é corroborada, por exemplo, em Silveira e 18 Afirma-se, na nota de rodapé 3 do Laudo, que o valor de base corresponderia à “posição de relaxamento que uma articulação retorna depois de uma excursão no espaço articulatório”. O conceito de “F0 baseline”, que pode ser traduzido para o português por valor de base da f0 ou linha de base da f0 é um conceito que não se refere a excursões de articuladores (entendidos aqui como os articuladores supraglotais), mas sim de excursões da f0 ou frequência fundamental da fala, que é o resultado acústico da vibração das pregas vocais. Portanto, é uma excursão no espaço tonal e não no espaço articulatório propriamente dito.
  • 9. Arantes (2017)19 , que examinaram auditiva e acusticamente amostras de fala com histogramas de f0 semelhantes aos mostrados nas figuras 4 e 5 do Laudo e confirmaram que ocorrências na cauda esquerda de uma amostra assimétrica de f0, que eventualmente conferem a essa distribuição um caráter bimodal, são, em muitos casos, ocorrências de vozeamento crepitante. O mesmo trabalho mostra, ainda, que em um corpus composto por amostras de fala espontânea de sete línguas, entre elas o português brasileiro, uma porcentagem expressiva dos falantes apresenta ocorrências de vozeamento não modal, entre eles voz crepitante. Entre os falantes do português brasileiro, esse é o caso para 70% dos falantes. Resultados que vão nessa mesma direção foram relatados em outros estudos que também analisaram o português brasileiro (OLIVEIRA, 201720 , SOUSA, 201721 ). A alta incidência de vozeamento não modal na fala é típica não apenas no português, mas em uma quantidade expressiva de outras línguas em que o fenômeno já foi estudado (ver revisão bibliográfica em Sousa 2016). Considerando os fatos apresentados na literatura, é possível concluir que a simples presença de instâncias de vozeamento não modal nas amostras padrão e questionada não tem um poder evidenciário especialmente importante, uma vez que é um fenômeno prevalente na língua. Como corolário, segue que o mesmo pode ser dito da semelhança na forma dos histogramas. Cabe notar que Oliveira (2017) e Sousa (2017) mostram que há variabilidade entre falantes na taxa individual de produção de vozeamento não modal, embora não se tenha demonstrado de maneira segura se o grau de variabilidade intrafalante é efetivamente maior do que a variação entre diferentes falantes, o que seria um requisito para o seu uso como parâmetro com bom poder discriminador. De todo modo, o Laudo não apresenta valores de taxa de produção desses eventos nas duas amostras em comparação, o que impede uma comparação dessa natureza. 6. Da conclusão Os fundamentos da realização do exame de comparação de locutor são apresentados na seção III.3 do Laudo. Um dos elementos relevantes constantes dessa seção é a sistemática adotada para apresentação das conclusões do exame que resultam da consolidação do conjunto dos exames realizados nas amostras submetidas a análise. No texto da mesma seção, após discutir as dificuldades de adoção de uma escala quantitativa, justificada por limitações que impedem que todos os exames tenham resultados quantitativos, declara-se o uso de uma escala qualitativa, que é adotada por diversas instituições internacionais. Essa escala tem nove pontos, que vão de -4 a +4, passando pelo zero. Os pontos devem expressar diferentes graus de confirmação ou rejeição da hipótese de origem das duas amostras, a questionada e a padrão. Comumente, essa hipótese assume que as duas amostras têm a mesma origem, isto é, foram produzidas pelo mesmo falante. Assim, o nível -4 deveria ser usado quando as evidências contradizem a hipótese de mesma origem muito fortemente; o nível +4 seria reservado aos casos em que as evidências confirmam muito fortemente a hipótese de mesma origem; finalmente, o nível 0 deve ser usado quando as evidências são inconclusivas, isto é, 19 TORIKAI, K. Avaliação do desempenho do algoritmo de extração da frequência fundamental da fala do programa Praat. Trabalho de Conclusão de Curso—São Carlos: Universidade Federal de São Carlos, 2015. 20 SILVEIRA, I. J.; ARANTES, P. Efeitos do vozeamento não modal na descrição estatística de amostras de frequência fundamental. Anais do Congresso Brasileiro de Prosódia da Fala. Anais... Em: IV COLÓQUIO BRASILEIRO DE PROSÓDIA DA FALA. Mariana-MG: Associação Luso-Brasileira de Ciências da Fala, 2017. 21 OLIVEIRA, J. C. C. Laringalização no português brasileiro: uma análise em torno do fenômeno laríngeo e implicações para a comparação de locutor. Dissertação de mestrado—Maceió: Universidade Federal de Alagoas, 2017.
  • 10. quando não ajudam a confirmar ou rejeitar a hipótese em jogo. Os valores intermediários são gradações nas duas direções. Muito embora essa escala seja usada por muitas instituições, Eriksson, o mesmo autor citado no Laudo quando justifica o seu uso, lembra que o uso de escalas qualitativas “dá margem à subjetividade, em particular quando se pesa e combina os resultados da análise de diversos parâmetros”22 (ERIKSSON, 2011, p. 60). Portanto, sem um protocolo explícito, motivado e rigoroso que guie a relação entre os achados presentes no corpo evidenciário reunido pelo exame pericial e atribuição de um nível numérico na escala, essa relação corre o risco de ser estabelecida de maneira relativamente livre e subjetiva. Ressaltamos que já existem propostas para relacionar de forma motivada e sistemática o resultado de análises de variáveis linguísticas a graus em uma escala quantitativa como a sugerida por Eriksson (2011). Uma proposta desse tipo é apresentada em Barbosa (2020). Na seção IV do Laudo, o texto conclui que o conjunto dos exames apresentados na seção III.4 corrobora fortemente a hipótese de mesma origem para as amostras padrão e questionada, resultado que corresponde ao nível +3 na escala. Segundo o Laudo, a decisão levou em conta “os graus de relevância e de recorrência das convergências encontradas nos materiais analisados” (p. 9). Deve-se frisar que o texto do Laudo não explicita nem justifica em nenhum momento o grau de relevância atribuído a cada exame apresentado na seção III.4, tanto os de natureza perceptiva quanto acústica. Adiciona-se a isso a ausência de corroboração empírica apresentada no corpo do texto do Laudo em especial para as afirmações constantes na seção III.4.1. Finalmente, deve-se ainda chamar a atenção para a ausência de bases seguras na literatura especializada que ajudem ponderar de maneira mais objetiva o poder indiciário de alguns exames, em especial os reportados na seção III.4.1. O que de mais seguro as afirmações presentes no Laudo permitem dizer é que ambos os falantes são indivíduos do sexo masculino, falantes de alguma variedade linguística entre as diversas faladas na “região sul”. Se tomarmos a população combinada dos três estados da região sul conforme definida pelo IBGE, os falantes das amostras padrão e questionada são dois falantes em um universo de aproximadamente 15 milhões de pessoas, considerando a população conjunta dos três estados, divulgada na prévia do Censo Demográfico 202223 . Levando em conta que as duas vozes fazem uso de um registro melódico relativamente mais baixo do que a média da população, esse número pode ser reduzido para aproximadamente 5 milhões, conforme expus na seção 5 do presente parecer, o que, do ponto de vista da possibilidade de um falso positivo na identificação, é inaceitavelmente alto. Considerando todo o exposto anteriormente, avalio que o teor do que é apresentado no Laudo não justifica a atribuição do nível +3 consignado pelo Laudo em sua seção IV. Levando em conta todos os argumentos trazidos ao longo do presente parecer, meu melhor juízo é que os resultados relatados no Laudo são mais compatíveis com a atribuição do nível 0 na escala adotada, que equivale à descrição verbal “o resultado nem corrobora nem contradiz a hipótese”. A razão para essa conclusão são a inespecificidade e baixo poder discriminatório das características linguísticas identificadas e analisadas no Laudo. CONCLUSÃO: com base nas análises técnicas realizadas e na minha experiência profissional como doutor na área de linguística, especialista na área de fonética, pesquisador 22 SOUSA, N. E. V. Laringalização e proeminências em fala espontânea - considerações sobre a estrutura prosódica do português brasileiro. Trabalho de Conclusão de Curso—Brasília: Universidade de Brasília, 2017. 23 No original: “invites subjectivity, in particular when weighing and combining the results from analyses of several parameters” (ERIKSSON, 2011, p. 60).
  • 11. na área de fonética forense e autor de diversos artigos e outras publicações na área, afirmo que o nível 0 seria o adequado para o caso, não se podendo corroborar, nem contradizer a hipótese de mesma origem para as vozes. É o nosso parecer, elaborado em 11 páginas, digitalmente assinado. São Carlos, 5 de junho de 2023 PABLO ARANTES Professor Adjunto Laboratório de Fonética – Departamento de Letras Universidade Federal de São Carlos