Este documento discute o desenvolvimento de sistemas de reconhecimento de fala sensíveis ao contexto. Primeiro, descreve como o contexto do usuário e da aplicação podem afetar o reconhecimento de fala. Em seguida, propõe um modelo de processo para desenvolver sistemas de reconhecimento de fala adaptativos que consideram informações contextuais. Finalmente, relata experimentos com um sistema de reconhecimento de fala para controle de robôs móveis que se adapta ao contexto da tarefa.
ATIVIDADE 1 - GCOM - GESTÃO DA INFORMAÇÃO - 54_2024.docx
Influência do Contexto no Reconhecimento de fala
1. Influência do Contexto no
Reconhecimento de fala
Gabriel Ferreira Araujo
Orientador: Prof. Dr. Hendrik T. Macedo
Programa de pós-graduação em ciência da computação
Departamento de Computação
Universidade Federal de Sergipe
São Cristovão, Brazil
9. Eclipse Process Framework
● Engenharia de processos de software
● Suporta o desenvolvimento iterativo, ágil, e
incremental
○ OpenUP/Basic
● Baseado na especificação SPEM 1.1
○ Software Process Engineering Meta-Model
● Extensivo conjunto de ferramentas e conceitos
22. Reconhecimento de fala
automático sensível ao
contexto
● Sensível ao contexto do
usuário e da aplicação
● Se adapta com mudanças
de contexto
23. Mas o que significa
contexto?
O que é informação contextual?
24. Um conceito mal definido. Vago.
Mais de 150 definições.
Inteligência Artificial
Documentação Ergonomia cognitiva
Psicologia cognitiva
Administração
Linguística
Filosofia
25. “Contexto é qualquer informação
que pode ser usada para
caracterizar a situação de
uma entidade.”
— Anind K. Dey, 2001
32. Controle de navegação de
robôs móveis
- Interação em tempo real
- Interface baseada em fala
- Vocabulário restrito
- Comandos pré-defindos
comando = <ação> [precisão] [referência]
35. Experimentos e Resultados
- Modelo linguístico 3-gram
- 4 modelos linguísticos diferentes
- 2 pesos de modelo diferentes
- Informação contextual: presença e visibilidade
- Lista de sinônimos
- Word error rate (WER)
- Word information lost (WIL)
37. Conclusões
- Redução global nas taxas de erro
- Redução de até 3,3% na taxa WIL
- Maior nível de abstração
- Thesaurus
- Gramática probabilística
38. ● SBIA - Qualis B2
○ “Context-sensitive ASR for controlling the
navigation of mobile robots”
● Journal of Computer Science - Qualis B3
○ “Parallel Implementation of Expectation-
Maximization Algorithm for the Training of
Gaussian Mixture Models”
● EATIS - Qualis B4
○ “Context formalization and its use on dynamic
adaptation of language model in ASR systems”
Publicações