SlideShare ist ein Scribd-Unternehmen logo
1 von 46
Downloaden Sie, um offline zu lesen
06/11/19 1/1
La voix avec Common Voice
@hellosct1
@hellosct1@mamot.fr
Christophe Villeneuve
Christophe Villeneuve ?
Consultant
Dresseur animaux Free Software
Aujourd’hui
Assistants vocaux
Construire son Assistant
La qualité
Assistants vocaux
Construire son Assistant
La qualité
Assistant numérique :
au service de l’utilisateur
Smartphone
Enceinte connectée
Mixed Reality
Souvent utilisé dans des
contextes où la voix est plus
efficace pour communiquer
Que faire avec ?
Matériels
Traitement de la voix
Obligation d’un réseau
– Connecter aux internets
Accès aux services cloud pour pouvoir fonctionner
– Entrainement et transcription gourmands en
calculs
Contraintes
– Souvent laissé à des services tiers en-ligne
– Nécessite beaucoup de données audio avec
texte associé
– Voix personnelle, mais enregistrement parfois
constant
Fonctionnement
Assistant vocaux
Requêtes
Résultat
Traitement
L’utilisation de la recherche
vocale aujourd’hui
2016 2020
2016 2020
+ 50 % web
Aujourd’hui : Un constat
Des gros acteurs (4-5)
– Dominé par les géants du Web d’aujourd’hui
Difficile d’accès pour les petits acteurs
– Développeurs logiciels
– Langues et marchés « minoritaires »
Alternative pour outiller la communauté
– Emergence d’outils vocaux
→ Projet Common Voice de Mozilla
Alternative
Raspberry PI
– Respeaker 2 – Mics PI Hat
Arduino
– Movi d’Audème
– Grasp.io
– Voice Recognition
Briques pour Les assistants vocaux
– Common Voice – DeepSpeech de Mozilla
Common Voice
But
– Aider à apprendre aux machines comment les
humains parlent vraiment
Destiné à rendre la reconnaissance vocale ouverte et accessible à
tout le monde
Objectifs
– 10 000 heures de données validées par langue
– Mini 2 000 heures
→ Assistant numérique et voix
Common Voice & Deep Speech
Objectifs (1/2)
Cassons les barrières de la voix
– Accès : peu de gros jeux de données publiquement
accessibles
– Coût : ticket d’entrée important pour les jeux de
données commerciaux, avec des complexités
légales
– Biais : seuls certains marchés sont bien pourvus
Objectifs (2/2)
Collecte de données ouvertes pour l’apprentissage machine
Données : audio et texte correspondant
Diversité
– Langues
– Accents
– Ages
– Genres
– Qualité sonore
Nous visons 10 000 heures de données validées par langue :
https://voice.mozilla.org
Ingredients
Assistants vocaux
Construire son Assistant
La qualité
Construire son assistant
Import
CC0
Import
CC0
Sentence
Collector
Sentence
Collector
SaisieSaisie
Voice.mozilla.org → Parler
https://voice.mozilla.org/speak
Voice.mozilla.org → Ecouter
https://voice.mozilla.org/listen
Proposer et valider
de nouvelles phrases
Posséder un compte sur Common Voice.
Identifiez-vous sur le Collecteur de phrases
– Avec vos identifiants de Common Voice.
Validation des phrases
Page
→ page de validation.
Ajouter de nouvelle phrases
Page
→ Ajouter une nouvelle phrase
Collecteur de phrases : Ajouter
https://common-voice.github.io/sentence-collector/
Collecteur de phrases : Valider
https://common-voice.github.io/sentence-collector/
Heures enregistrées / Heures validées
Qualité ?
Mots ajoutés
Les mots ajoutés quand on parle
L’erreur est le mot ‘de’ qui a été ajouté
Elle est située dans la zec
Louise- Gosford, une aire
publique de chasse et de pêche
Elle est située dans la zec
Louise- Gosford, une aire
publique de chasse et de pêche
Mots oubliés
Les mots qu’on oublie
L’erreur est le mot ‘de’ qui a été oublié
Angel est sur le point de
l’interroger mais Wo-Pang se
suicide
Angel est sur le point de
l’interroger mais Wo-Pang se
suicide
Mots accrochés
Les mots qu’on accroche
La première syllabe du mot ‘Phénicie’ a été accrochée
Elle relie le nord de l’égypte à
la Phé Phénicie, l’Assyrie et la
Mésopotamie
Elle relie le nord de l’égypte à
la Phé Phénicie, l’Assyrie et la
Mésopotamie
Lettre(s) oubliée(s)
Les lettres oubliées qui modifient le sens de la phrase
La lettre ‘s’ a été oubliée
→ la phrase ne veut plus rien dire
En conséquence, Durant
Motors perdit des parts de
marché et des revendeurs.
En conséquence, Durant
Motors perdit des parts de
marché et des revendeurs.
Inversion de syllabe
Une syllabe inversée dans un mot
Le môt ‘évêché’ est prononcé « échevé »
→ qui est une erreur
Selon l’échevé de Liège, l’abbé
Schoonbroodt ne dispose
d’aucun recours.
Selon l’échevé de Liège, l’abbé
Schoonbroodt ne dispose
d’aucun recours.
Matériels
Mauvaise compréhension
de l’échantillon
Le matériel « Micro » de mauvaise qualité
Un « brouhaha » empêche la compression
Bruit de souffle
Le réglage du micro est mal réglé ou trop élevé
→ Nous obtenons un bruit de souffle
Volume faible
Le volume du micro est faible
→ rend l’échantillon incompréhensible
Début coupé
le ou les premiers mots ne sont pas enregistrés
L’enregistrement est déclenché trop tard
Les deux premiers ne sont enregistrés
→ Clavier ou souris appuyé trop tard
Puis il affine son plumage et
replie les ailes.
Puis il affine son plumage et
replie les ailes.
Echantillon coupé
l’enregistrement de l’échantillon est stoppé avant la fin
→ Il manque une partie de la phrase
Les droits de Gielow sont
ensuite rachetés au moment
de la Réforme protestante.
Les droits de Gielow sont
ensuite rachetés au moment
de la Réforme protestante.
Le dernier mot a été coupé
le ou les derniers mots sont coupés avant la fin de l’enregistrement
La dernière syllabe du mot ‘Montgeroult’ est coupé
L’ensemble du groupe scolaire
se situe à Montgeroult.
L’ensemble du groupe scolaire
se situe à Montgeroult.
Construire son assistant
DeepSpeech
Speech To Text
– Voix vers le texte
Text To Speech
– Texte vers la Voix
Données ouvertes
Décentraliser les données : plus de pouvoir aux utilisateurs et
contributeurs
– Facile à obtenir, exploiter
– Partage des données
– Intégration dans d’autres
jeux de données
– Outiller les communautés
https://voice.mozilla.org/fr/datas
ets
La répartition des données
Accent
64% Français de France
3% Français de Belgique
2% Français de Suisse
1% Français du Canada
Âge
< 19 : 4 %
19 - 29 : 24 %
30 - 39 : 21 %
40 - 49 : 17 %
50 - 59 : 5 %
60 - 69 : 6 %
Genre
70 % Masculin
9 % Féminin
Jeux de données vocales disponible
– Contenu officiel https://voice.mozilla.org/fr/datasets
Comment fait on ?
Modèles
– https://github.com/mozilla/deepspeech
Languages
– Python / Rust / NodeJS / .Net
Projets locals
– Pas de dépendance aux réseaux
Compatilibité Navigateurs
– Firefox et les autres
Projets disponible
Assistants numériques
– Mycroft
– Snips
– Université de Bangor (Pays de Galles)
Assistant personnel
– Leon
Transcription des messages
– FusionPBX
https://voice.mozilla.org
Alors
Pensez à faire des pauses
Changez vous l’esprit
Un peu de détente
Allez plus loin !
Site officiel Common Voice
– https://voice.mozilla.org/
Dépôt Github Francophone Common Voice – DeepSpeech
– https://github.com/Common-Voice/commonvoice-fr
Nous contacter
– Forum Discourse Francophone
• https://discourse.mozilla.org/c/voice/fr
Merci
Christophe Villeneuve
@hellosct1
@hellosct1@mamot.fr

Weitere ähnliche Inhalte

Ähnlich wie La voix avec common voice

AfricaSys SARL Portefolio Nous pouvons vous aider
AfricaSys SARL Portefolio Nous pouvons vous aiderAfricaSys SARL Portefolio Nous pouvons vous aider
AfricaSys SARL Portefolio Nous pouvons vous aiderAfricaSys
 
Les Soirées de l'iA #1 - Système de reconnaissance de la parole, où en est-o...
Les Soirées de l'iA #1 - Système de reconnaissance de la parole, où en est-o...Les Soirées de l'iA #1 - Système de reconnaissance de la parole, où en est-o...
Les Soirées de l'iA #1 - Système de reconnaissance de la parole, où en est-o...Axys
 
Prendre le virage du SEO vocal
Prendre le virage du SEO vocalPrendre le virage du SEO vocal
Prendre le virage du SEO vocalAlexandraBornot
 
Séminaire Ist inria 2014 : Pascale Sébillot
Séminaire Ist inria 2014 : Pascale SébillotSéminaire Ist inria 2014 : Pascale Sébillot
Séminaire Ist inria 2014 : Pascale SébillotInria
 
Les nouveaux services conversationnels
Les nouveaux services conversationnelsLes nouveaux services conversationnels
Les nouveaux services conversationnelsCap'Com
 
Assistants virtuels intelligents: Comment appréhender ces nouvelles interfaces ?
Assistants virtuels intelligents: Comment appréhender ces nouvelles interfaces ?Assistants virtuels intelligents: Comment appréhender ces nouvelles interfaces ?
Assistants virtuels intelligents: Comment appréhender ces nouvelles interfaces ?Elias Platek
 
Formation internet pour les élèves de lécole Saint joseph (69700)
Formation internet pour les élèves de lécole Saint joseph (69700)Formation internet pour les élèves de lécole Saint joseph (69700)
Formation internet pour les élèves de lécole Saint joseph (69700)svillacampa
 
2009-09-26 xmpp jabber for beginners at mediatheque fleury
2009-09-26 xmpp jabber for beginners at mediatheque fleury2009-09-26 xmpp jabber for beginners at mediatheque fleury
2009-09-26 xmpp jabber for beginners at mediatheque fleurylgilbon
 
Correcteur terminologique pour OpenOffice.org
Correcteur terminologique pour OpenOffice.orgCorrecteur terminologique pour OpenOffice.org
Correcteur terminologique pour OpenOffice.orgAlexis Monville
 
Intelligence Artificielle: Vers l'ère de l'imagination
Intelligence Artificielle: Vers l'ère de l'imaginationIntelligence Artificielle: Vers l'ère de l'imagination
Intelligence Artificielle: Vers l'ère de l'imaginationTony Aubé
 
En attendant le Poisson de Babel
En attendant le Poisson de BabelEn attendant le Poisson de Babel
En attendant le Poisson de Babelsbooth
 
Le numérique en médiathèque : premiers pas
Le numérique en médiathèque : premiers pasLe numérique en médiathèque : premiers pas
Le numérique en médiathèque : premiers pascspirin
 
Internet a ses debuts Un atelier de la CCI de Melun en 1999
Internet a ses debuts Un atelier de la CCI de Melun en 1999Internet a ses debuts Un atelier de la CCI de Melun en 1999
Internet a ses debuts Un atelier de la CCI de Melun en 1999AXIZ eBusiness
 
Institut Télécom : bourse aux technos 2010
Institut Télécom : bourse aux technos 2010Institut Télécom : bourse aux technos 2010
Institut Télécom : bourse aux technos 201001informatique
 

Ähnlich wie La voix avec common voice (20)

Forum Chat Mail
Forum Chat MailForum Chat Mail
Forum Chat Mail
 
AfricaSys SARL Portefolio Nous pouvons vous aider
AfricaSys SARL Portefolio Nous pouvons vous aiderAfricaSys SARL Portefolio Nous pouvons vous aider
AfricaSys SARL Portefolio Nous pouvons vous aider
 
A la rencontre du bot
A la rencontre du botA la rencontre du bot
A la rencontre du bot
 
Les Soirées de l'iA #1 - Système de reconnaissance de la parole, où en est-o...
Les Soirées de l'iA #1 - Système de reconnaissance de la parole, où en est-o...Les Soirées de l'iA #1 - Système de reconnaissance de la parole, où en est-o...
Les Soirées de l'iA #1 - Système de reconnaissance de la parole, où en est-o...
 
Prendre le virage du SEO vocal
Prendre le virage du SEO vocalPrendre le virage du SEO vocal
Prendre le virage du SEO vocal
 
Projet Complet: Paramètres Régionaux Pour 100 Langues Africaines
Projet Complet: Paramètres Régionaux Pour 100 Langues AfricainesProjet Complet: Paramètres Régionaux Pour 100 Langues Africaines
Projet Complet: Paramètres Régionaux Pour 100 Langues Africaines
 
Webinar CNIL
Webinar CNIL Webinar CNIL
Webinar CNIL
 
Séminaire Ist inria 2014 : Pascale Sébillot
Séminaire Ist inria 2014 : Pascale SébillotSéminaire Ist inria 2014 : Pascale Sébillot
Séminaire Ist inria 2014 : Pascale Sébillot
 
Les nouveaux services conversationnels
Les nouveaux services conversationnelsLes nouveaux services conversationnels
Les nouveaux services conversationnels
 
Assistants virtuels intelligents: Comment appréhender ces nouvelles interfaces ?
Assistants virtuels intelligents: Comment appréhender ces nouvelles interfaces ?Assistants virtuels intelligents: Comment appréhender ces nouvelles interfaces ?
Assistants virtuels intelligents: Comment appréhender ces nouvelles interfaces ?
 
WinRT et l'accès aux données
WinRT et l'accès aux donnéesWinRT et l'accès aux données
WinRT et l'accès aux données
 
Formation internet pour les élèves de lécole Saint joseph (69700)
Formation internet pour les élèves de lécole Saint joseph (69700)Formation internet pour les élèves de lécole Saint joseph (69700)
Formation internet pour les élèves de lécole Saint joseph (69700)
 
2009-09-26 xmpp jabber for beginners at mediatheque fleury
2009-09-26 xmpp jabber for beginners at mediatheque fleury2009-09-26 xmpp jabber for beginners at mediatheque fleury
2009-09-26 xmpp jabber for beginners at mediatheque fleury
 
Correcteur terminologique pour OpenOffice.org
Correcteur terminologique pour OpenOffice.orgCorrecteur terminologique pour OpenOffice.org
Correcteur terminologique pour OpenOffice.org
 
Intelligence Artificielle: Vers l'ère de l'imagination
Intelligence Artificielle: Vers l'ère de l'imaginationIntelligence Artificielle: Vers l'ère de l'imagination
Intelligence Artificielle: Vers l'ère de l'imagination
 
En attendant le Poisson de Babel
En attendant le Poisson de BabelEn attendant le Poisson de Babel
En attendant le Poisson de Babel
 
La French Mobile 21 09 2010
La French Mobile 21 09 2010La French Mobile 21 09 2010
La French Mobile 21 09 2010
 
Le numérique en médiathèque : premiers pas
Le numérique en médiathèque : premiers pasLe numérique en médiathèque : premiers pas
Le numérique en médiathèque : premiers pas
 
Internet a ses debuts Un atelier de la CCI de Melun en 1999
Internet a ses debuts Un atelier de la CCI de Melun en 1999Internet a ses debuts Un atelier de la CCI de Melun en 1999
Internet a ses debuts Un atelier de la CCI de Melun en 1999
 
Institut Télécom : bourse aux technos 2010
Institut Télécom : bourse aux technos 2010Institut Télécom : bourse aux technos 2010
Institut Télécom : bourse aux technos 2010
 

Mehr von Christophe Villeneuve

La boîte à outils de développements dans Firefox
La boîte à outils de développements dans FirefoxLa boîte à outils de développements dans Firefox
La boîte à outils de développements dans FirefoxChristophe Villeneuve
 
controler vos donnees éthiques dans le web
controler vos donnees éthiques dans le webcontroler vos donnees éthiques dans le web
controler vos donnees éthiques dans le webChristophe Villeneuve
 
Open Source et contribution : Une association gagnante
Open Source et contribution : Une association gagnanteOpen Source et contribution : Une association gagnante
Open Source et contribution : Une association gagnanteChristophe Villeneuve
 
Peur de la migration vers l’open source ?
Peur de la migration vers l’open source ?Peur de la migration vers l’open source ?
Peur de la migration vers l’open source ?Christophe Villeneuve
 
La sécurité applicative par le design
La sécurité applicative par le designLa sécurité applicative par le design
La sécurité applicative par le designChristophe Villeneuve
 
Mozilla french speaking community activites
Mozilla french speaking community activitesMozilla french speaking community activites
Mozilla french speaking community activitesChristophe Villeneuve
 
Monitoring dynamique : Grafana et Microsoft
Monitoring dynamique : Grafana et MicrosoftMonitoring dynamique : Grafana et Microsoft
Monitoring dynamique : Grafana et MicrosoftChristophe Villeneuve
 
Le futur de l'authentification webAuthn
Le futur de l'authentification webAuthnLe futur de l'authentification webAuthn
Le futur de l'authentification webAuthnChristophe Villeneuve
 
Tests d'accessibilite par la pratique
Tests d'accessibilite par la pratiqueTests d'accessibilite par la pratique
Tests d'accessibilite par la pratiqueChristophe Villeneuve
 
La réalité mélangée dans vos applications
La réalité mélangée dans vos applicationsLa réalité mélangée dans vos applications
La réalité mélangée dans vos applicationsChristophe Villeneuve
 

Mehr von Christophe Villeneuve (20)

MariaDB une base de donnees NewSQL
MariaDB une base de donnees NewSQLMariaDB une base de donnees NewSQL
MariaDB une base de donnees NewSQL
 
La boîte à outils de développements dans Firefox
La boîte à outils de développements dans FirefoxLa boîte à outils de développements dans Firefox
La boîte à outils de développements dans Firefox
 
pister les pisteurs
pister les pisteurspister les pisteurs
pister les pisteurs
 
controler vos donnees éthiques dans le web
controler vos donnees éthiques dans le webcontroler vos donnees éthiques dans le web
controler vos donnees éthiques dans le web
 
Infrastructure as code drupal
Infrastructure as code drupalInfrastructure as code drupal
Infrastructure as code drupal
 
Mariadb une base de données NewSQL
Mariadb une base de données NewSQLMariadb une base de données NewSQL
Mariadb une base de données NewSQL
 
Open Source et contribution : Une association gagnante
Open Source et contribution : Une association gagnanteOpen Source et contribution : Une association gagnante
Open Source et contribution : Une association gagnante
 
Pentest bus pirate
Pentest bus piratePentest bus pirate
Pentest bus pirate
 
Peur de la migration vers l’open source ?
Peur de la migration vers l’open source ?Peur de la migration vers l’open source ?
Peur de la migration vers l’open source ?
 
La sécurité applicative par le design
La sécurité applicative par le designLa sécurité applicative par le design
La sécurité applicative par le design
 
Foxfooding semaine 3
Foxfooding semaine 3Foxfooding semaine 3
Foxfooding semaine 3
 
Foxfooding
FoxfoodingFoxfooding
Foxfooding
 
Accessibilite web wcag rgaa
Accessibilite web wcag rgaaAccessibilite web wcag rgaa
Accessibilite web wcag rgaa
 
Mozilla french speaking community activites
Mozilla french speaking community activitesMozilla french speaking community activites
Mozilla french speaking community activites
 
Monitoring dynamique : Grafana et Microsoft
Monitoring dynamique : Grafana et MicrosoftMonitoring dynamique : Grafana et Microsoft
Monitoring dynamique : Grafana et Microsoft
 
Etes vous-pret pour php8 ?
Etes vous-pret pour php8 ?Etes vous-pret pour php8 ?
Etes vous-pret pour php8 ?
 
Le futur de l'authentification webAuthn
Le futur de l'authentification webAuthnLe futur de l'authentification webAuthn
Le futur de l'authentification webAuthn
 
Send large files with addons
Send large files with addonsSend large files with addons
Send large files with addons
 
Tests d'accessibilite par la pratique
Tests d'accessibilite par la pratiqueTests d'accessibilite par la pratique
Tests d'accessibilite par la pratique
 
La réalité mélangée dans vos applications
La réalité mélangée dans vos applicationsLa réalité mélangée dans vos applications
La réalité mélangée dans vos applications
 

La voix avec common voice

  • 1. 06/11/19 1/1 La voix avec Common Voice @hellosct1 @hellosct1@mamot.fr Christophe Villeneuve
  • 4. Assistants vocaux Construire son Assistant La qualité
  • 5. Assistant numérique : au service de l’utilisateur Smartphone Enceinte connectée Mixed Reality Souvent utilisé dans des contextes où la voix est plus efficace pour communiquer Que faire avec ?
  • 7. Traitement de la voix Obligation d’un réseau – Connecter aux internets Accès aux services cloud pour pouvoir fonctionner – Entrainement et transcription gourmands en calculs Contraintes – Souvent laissé à des services tiers en-ligne – Nécessite beaucoup de données audio avec texte associé – Voix personnelle, mais enregistrement parfois constant
  • 9. L’utilisation de la recherche vocale aujourd’hui 2016 2020 2016 2020 + 50 % web
  • 10. Aujourd’hui : Un constat Des gros acteurs (4-5) – Dominé par les géants du Web d’aujourd’hui Difficile d’accès pour les petits acteurs – Développeurs logiciels – Langues et marchés « minoritaires » Alternative pour outiller la communauté – Emergence d’outils vocaux → Projet Common Voice de Mozilla
  • 11. Alternative Raspberry PI – Respeaker 2 – Mics PI Hat Arduino – Movi d’Audème – Grasp.io – Voice Recognition Briques pour Les assistants vocaux – Common Voice – DeepSpeech de Mozilla
  • 12. Common Voice But – Aider à apprendre aux machines comment les humains parlent vraiment Destiné à rendre la reconnaissance vocale ouverte et accessible à tout le monde Objectifs – 10 000 heures de données validées par langue – Mini 2 000 heures → Assistant numérique et voix Common Voice & Deep Speech
  • 13. Objectifs (1/2) Cassons les barrières de la voix – Accès : peu de gros jeux de données publiquement accessibles – Coût : ticket d’entrée important pour les jeux de données commerciaux, avec des complexités légales – Biais : seuls certains marchés sont bien pourvus
  • 14. Objectifs (2/2) Collecte de données ouvertes pour l’apprentissage machine Données : audio et texte correspondant Diversité – Langues – Accents – Ages – Genres – Qualité sonore Nous visons 10 000 heures de données validées par langue : https://voice.mozilla.org
  • 16. Assistants vocaux Construire son Assistant La qualité
  • 20. Proposer et valider de nouvelles phrases Posséder un compte sur Common Voice. Identifiez-vous sur le Collecteur de phrases – Avec vos identifiants de Common Voice. Validation des phrases Page → page de validation. Ajouter de nouvelle phrases Page → Ajouter une nouvelle phrase
  • 21. Collecteur de phrases : Ajouter https://common-voice.github.io/sentence-collector/
  • 22. Collecteur de phrases : Valider https://common-voice.github.io/sentence-collector/
  • 23.
  • 24. Heures enregistrées / Heures validées Qualité ?
  • 25. Mots ajoutés Les mots ajoutés quand on parle L’erreur est le mot ‘de’ qui a été ajouté Elle est située dans la zec Louise- Gosford, une aire publique de chasse et de pêche Elle est située dans la zec Louise- Gosford, une aire publique de chasse et de pêche
  • 26. Mots oubliés Les mots qu’on oublie L’erreur est le mot ‘de’ qui a été oublié Angel est sur le point de l’interroger mais Wo-Pang se suicide Angel est sur le point de l’interroger mais Wo-Pang se suicide
  • 27. Mots accrochés Les mots qu’on accroche La première syllabe du mot ‘Phénicie’ a été accrochée Elle relie le nord de l’égypte à la Phé Phénicie, l’Assyrie et la Mésopotamie Elle relie le nord de l’égypte à la Phé Phénicie, l’Assyrie et la Mésopotamie
  • 28. Lettre(s) oubliée(s) Les lettres oubliées qui modifient le sens de la phrase La lettre ‘s’ a été oubliée → la phrase ne veut plus rien dire En conséquence, Durant Motors perdit des parts de marché et des revendeurs. En conséquence, Durant Motors perdit des parts de marché et des revendeurs.
  • 29. Inversion de syllabe Une syllabe inversée dans un mot Le môt ‘évêché’ est prononcé « échevé » → qui est une erreur Selon l’échevé de Liège, l’abbé Schoonbroodt ne dispose d’aucun recours. Selon l’échevé de Liège, l’abbé Schoonbroodt ne dispose d’aucun recours.
  • 31. Mauvaise compréhension de l’échantillon Le matériel « Micro » de mauvaise qualité Un « brouhaha » empêche la compression
  • 32. Bruit de souffle Le réglage du micro est mal réglé ou trop élevé → Nous obtenons un bruit de souffle
  • 33. Volume faible Le volume du micro est faible → rend l’échantillon incompréhensible
  • 34. Début coupé le ou les premiers mots ne sont pas enregistrés L’enregistrement est déclenché trop tard Les deux premiers ne sont enregistrés → Clavier ou souris appuyé trop tard Puis il affine son plumage et replie les ailes. Puis il affine son plumage et replie les ailes.
  • 35. Echantillon coupé l’enregistrement de l’échantillon est stoppé avant la fin → Il manque une partie de la phrase Les droits de Gielow sont ensuite rachetés au moment de la Réforme protestante. Les droits de Gielow sont ensuite rachetés au moment de la Réforme protestante.
  • 36. Le dernier mot a été coupé le ou les derniers mots sont coupés avant la fin de l’enregistrement La dernière syllabe du mot ‘Montgeroult’ est coupé L’ensemble du groupe scolaire se situe à Montgeroult. L’ensemble du groupe scolaire se situe à Montgeroult.
  • 38. DeepSpeech Speech To Text – Voix vers le texte Text To Speech – Texte vers la Voix
  • 39. Données ouvertes Décentraliser les données : plus de pouvoir aux utilisateurs et contributeurs – Facile à obtenir, exploiter – Partage des données – Intégration dans d’autres jeux de données – Outiller les communautés https://voice.mozilla.org/fr/datas ets
  • 40. La répartition des données Accent 64% Français de France 3% Français de Belgique 2% Français de Suisse 1% Français du Canada Âge < 19 : 4 % 19 - 29 : 24 % 30 - 39 : 21 % 40 - 49 : 17 % 50 - 59 : 5 % 60 - 69 : 6 % Genre 70 % Masculin 9 % Féminin Jeux de données vocales disponible – Contenu officiel https://voice.mozilla.org/fr/datasets
  • 41. Comment fait on ? Modèles – https://github.com/mozilla/deepspeech Languages – Python / Rust / NodeJS / .Net Projets locals – Pas de dépendance aux réseaux Compatilibité Navigateurs – Firefox et les autres
  • 42. Projets disponible Assistants numériques – Mycroft – Snips – Université de Bangor (Pays de Galles) Assistant personnel – Leon Transcription des messages – FusionPBX
  • 44. Alors Pensez à faire des pauses Changez vous l’esprit Un peu de détente
  • 45. Allez plus loin ! Site officiel Common Voice – https://voice.mozilla.org/ Dépôt Github Francophone Common Voice – DeepSpeech – https://github.com/Common-Voice/commonvoice-fr Nous contacter – Forum Discourse Francophone • https://discourse.mozilla.org/c/voice/fr