Reconnaissance de la parole - PowerPoint PPT Presentation

lyn
reconnaissance de la parole n.
Skip this Video
Loading SlideShow in 5 Seconds..
Reconnaissance de la parole PowerPoint Presentation
Download Presentation
Reconnaissance de la parole

play fullscreen
1 / 12
Download Presentation
Presentation Description
184 Views
Download Presentation

Reconnaissance de la parole

- - - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript

  1. Reconnaissance de la parole SCIA 2008 Julien Assémat David Landais

  2. Plan • Introduction • Rappel du projet • Objectifs du projet • Un point sur l’état de l’Art • Méthode explicite • Méthode implicite • Performances • Approche du projet • Techniques et méthodes retenues • Applications

  3. Introduction • Rappel du projet • Système de reconnaissance vocale • Parole continue • Vocabulaire de grande taille • Objectifs du projet • Capacité de reconnaissance d’un signal de parole continue • Applicable à tout type de messages sonores (discours, …) • Taux de reconnaissance correct • Utilisation pour une application concrète

  4. Un point sur l’état de l’Art • Deux méthodes de conception selon les techniques utilisées • Méthode explicite • Méthode basée sur l’utilisation de connaissances explicites • Méthode implicite • Méthode basée sur une approche statistique

  5. Un point sur l’état de l’Art Méthode explicite • Première approche en reconnaissance de la parole dès 1970 • Basée sur l’utilisation de connaissances explicites • Comparaison à des formes de références (spectres, …) • Techniques • Systèmes multi-agents • Blackboard (Hearsay II) • Systèmes experts (1980) • Méthode peu performant


  6. Un point sur l’état de l’Art Méthode implicite • Approche statistique • Niveau phonétique (modèle acoustique) • Niveau linguistique (modèle de langue) • Nécessite un apprentissage • Techniques • Hidden Markov Models (HMM) • Algorithme N-gram • Réseaux de neurones

  7. Un point sur l’état de l’Art Modèle acoustique • Extraction de caractéristiques d’un signal • Travail sur les phonèmes propres à la langue • Utilisation du vecteur de caractéristiques extrait • Probabilité qu’une portion du signal appartienne à chacun des phonèmes de la langue (HMM) • Hidden Markov Models • Calculer la probabilité d'une séquence particulière

  8. Un point sur l’état de l’Art Modèle de langue • Travail sur la syntaxe et la sémantique propres à la langue • Probabilité qu’une suite de mots existe dans la langue • Introduction de la notion d’approximation avec N-gram • Algorithme N-gram • Agrégation en séquences de 2 ou 3 mots avec une probabilité associée • Approximation de probabilités de séquences plus longues • Calcul des probabilités sur ces séquences plutôt que sur des mots

  9. Un point sur l’état de l’Art Méthode implicite : résumé

  10. Un point sur l’état de l’Art Performances • Quelques chiffres en moyenne pour les systèmes actuels dans les mêmes conditions environnementales : • 0,3 % d’erreur pour l’énumération d’une suite de chiffres • 5 % d’erreurs pour un vocabulaire de 20 000 mots en parole continue • 8 % d’erreurs pour une énumération de lettres • 40 % d’erreurs pour une conversation téléphonique spontanée • En général, forte dépendance de certains paramètres • Taille du vocabulaire • Régionalisation (paramètre inter-locuteur) • Etat émotionnel (paramètre intra-locuteur)

  11. Approche du projet • Méthodes et techniques retenues • Utilisation de la méthode implicite • Meilleurs résultats • Utilisation des deux modèles (phonétique et linguistique) • Réseaux de neurones pour la reconnaissance des phonèmes • Applications • Indexation de messages sonores • Emissions radiophoniques • Discours • Conversation • …

  12. ?