<ul><li>Aktivitäten des Instituts </li></ul><ul><ul><li>Signaltrennung </li></ul></ul><ul><ul><li>     Independent Compon...
   Spracherkennung in gestörten Umgebungen leidet besonders  unter Überlagerung des erwünschten Sprachsignals mit anderen...
Sprechertrennung mit ICA    Independent Component Analysis (ICA) schätzt optimale  Entmischungsmatrix im Sinn der maximal...
   Erlaubt im Idealfall fast perfekte Trennung aus nur einem Mikrophonsignal  Sprachsignale Mischung Maskierungs- funktio...
ICA + Zeit-Frequenzmaskierung <ul><ul><li>   Independent Component  </li></ul></ul><ul><ul><li>Analysis kann genutzt  </l...
<ul><li>Zeit-Frequenzmaskierung verbessert ICA-Ergebnisse und bietet </li></ul><ul><ul><li>   Durchschnittliche Verbesser...
<ul><li>Eingesetzte Methoden zur Verwendung der Unsicherheitsinformation: </li></ul><ul><ul><li>   Uncertainty Decoding <...
Ergebnisse Spracherkennung
Anwendung zur Fehlerdetektion <ul><ul><li>   Independent Component  </li></ul></ul><ul><ul><li>Analysis kann genutzt  </l...
Vielen Dank!
Nächste SlideShare
Wird geladen in …5
×

Robuste Mehrsprecher-Spracherkennung mit ICA

350 Aufrufe

Veröffentlicht am

Veröffentlicht in: Technologie
0 Kommentare
0 Gefällt mir
Statistik
Notizen
  • Als Erste(r) kommentieren

  • Gehören Sie zu den Ersten, denen das gefällt!

Keine Downloads
Aufrufe
Aufrufe insgesamt
350
Auf SlideShare
0
Aus Einbettungen
0
Anzahl an Einbettungen
5
Aktionen
Geteilt
0
Downloads
0
Kommentare
0
Gefällt mir
0
Einbettungen 0
Keine Einbettungen

Keine Notizen für die Folie

Robuste Mehrsprecher-Spracherkennung mit ICA

  1. 1. <ul><li>Aktivitäten des Instituts </li></ul><ul><ul><li>Signaltrennung </li></ul></ul><ul><ul><li>  Independent Component Analysis </li></ul></ul><ul><ul><li>  Zeit-Frequenzmaskierung </li></ul></ul><ul><ul><li>Robuste Spracherkennung </li></ul></ul><ul><ul><li>  Missing-Data Techniken zur Erkennung gestörter Sprachsignale </li></ul></ul><ul><li>Anwendung zur Fehlerdetektion </li></ul><ul><ul><li>  Signalaufbereitung + HMM- oder DTW-Klassifikation </li></ul></ul>Überblick
  2. 2.  Spracherkennung in gestörten Umgebungen leidet besonders unter Überlagerung des erwünschten Sprachsignals mit anderen Sprechersignalen  Mikrofone zeichnen nur gefaltete Mischungen von Sprechersignalen auf  Ziel: Rekonstruktion einzelner Sprechersignale Mischungen Independent Component Analysis
  3. 3. Sprechertrennung mit ICA  Independent Component Analysis (ICA) schätzt optimale Entmischungsmatrix im Sinn der maximalen statistischen Unabhängigkeit der Signale Rekonstruktionen mit linearen ICA-Methoden A(  ) -1 A(  ) gefaltete Mischung S 1 (  ) S 2 (  ) X 1 (  ) X 2 (  ) Y 1 (  ) Y 2 (  ) Max. Unab- hängigkeit für alle 
  4. 4.  Erlaubt im Idealfall fast perfekte Trennung aus nur einem Mikrophonsignal Sprachsignale Mischung Maskierungs- funktion Zeit-Frequenzmaskierung
  5. 5. ICA + Zeit-Frequenzmaskierung <ul><ul><li> Independent Component </li></ul></ul><ul><ul><li>Analysis kann genutzt </li></ul></ul><ul><ul><li>werden, um Signale linear </li></ul></ul><ul><ul><li>zu trennen und um die </li></ul></ul><ul><ul><li>Berechnung einer zusätzlichen </li></ul></ul><ul><ul><li>Zeit-Frequenz-Maske zu </li></ul></ul><ul><ul><li>ermöglichen. </li></ul></ul><ul><ul><li>Ohne Maskierung: </li></ul></ul><ul><ul><li>Mit Maskierung: </li></ul></ul>
  6. 6. <ul><li>Zeit-Frequenzmaskierung verbessert ICA-Ergebnisse und bietet </li></ul><ul><ul><li> Durchschnittliche Verbesserung des Signal-Störverhältnisses von </li></ul></ul><ul><ul><li>3.4dB gegenüber ICA allein </li></ul></ul><ul><ul><li> Geringen Rechenaufwand </li></ul></ul><ul><ul><li> Robustheit gegenüber Störgeräuschen </li></ul></ul><ul><li>Aber verbessertes SNR verbessert Spracherkennung nur wenig </li></ul><ul><ul><li> Das liegt wahrscheinlich an veränderten </li></ul></ul><ul><ul><li> Merkmalen, aber die menschliche Erkennung </li></ul></ul><ul><ul><li> von zeigt, dass auch im gestörten Signal </li></ul></ul><ul><ul><li> genug Information für die Erkennung präsent ist. </li></ul></ul><ul><li>Mögliche Lösung: Einsatz von Missing-Data Techniken </li></ul>Zeit-Frequenzmaskierung
  7. 7. <ul><li>Eingesetzte Methoden zur Verwendung der Unsicherheitsinformation: </li></ul><ul><ul><li> Uncertainty Decoding </li></ul></ul><ul><ul><li> „ Data Imputation“ </li></ul></ul><ul><ul><li> Modified Imputation </li></ul></ul>S(  ) Quellen- Trennung HMM- Spracherkennung Punkt- schätzung x 1 (t) x 2 (t) Quellen- Trennung HMM- Spracherkennung Unsicherheits- information x 1 (t) x 2 (t) S(  ),  S(  )) Missing-Data Techniken
  8. 8. Ergebnisse Spracherkennung
  9. 9. Anwendung zur Fehlerdetektion <ul><ul><li> Independent Component </li></ul></ul><ul><ul><li>Analysis kann genutzt </li></ul></ul><ul><ul><li>werden, um Signale linear </li></ul></ul><ul><ul><li>zu trennen und die </li></ul></ul><ul><ul><li>Berechnung einer optionalen </li></ul></ul><ul><ul><li>Zeit-Frequenz-Maske zu </li></ul></ul><ul><ul><li>ermöglichen. </li></ul></ul><ul><ul><li> Anschliessende Erkennung kann </li></ul></ul><ul><ul><li>sowohl mit DTW als auch mit </li></ul></ul><ul><ul><li>HMMs zur Musterklassifikation </li></ul></ul><ul><ul><li>und Fehlererkennung </li></ul></ul><ul><ul><li>eingesetzt werden. </li></ul></ul>
  10. 10. Vielen Dank!

×