Analyse du signal de parole pour l'évaluation automatique des voix pathologiques

Type : Thèse de doctorat
Auteur(s) :  Mounir BOUDJERDA
Directeurs du mémoire/thèse :  -
Année :  2018
Domaine : Electronique
Etablissement :  Université Abdelhak Benhamouda de Jijel
Résumé en PDF :  (résumé en pdf)
Fulltext en PDF :  (.pdf)
Mots clés :  Voix pathologiques, Décomposition Modale Empirique, Algorithme Génétique, indices acoustiques

Résumé :

L’analyse acoustique du signal de parole pour le diagnostique et l’évaluation automatique des voix pathologiques est une discipline qui nécessite encore des investigations en raison des difficultés de développer des méthodes standards pouvant aider les cliniciens et les spécialistes de la voix pour évaluer et suivre l’évolution de la voix des patients avec une bonne précision. L’analyse du signal acoustique a pour objectif d’extraire des indices pertinents permettant de déterminer les caractéristiques de la voix. L'objectif de cette thèse est le développement de méthodes d’analyse acoustique dédiées à l'évaluation automatique objective de la qualité de la voix produite par des locuteurs dysphoniques. Dans ce travail, on s’intéresse à l’estimation des dyspériodicités vocales en utilisant la décomposition modale empirique dans le domaine log-spectral. Nous développons deux méthodes d’analyse. La première méthode est basée sur l'estimation de la source glottique via la décomposition modale empirique et la deuxième méthode est basée sur l'optimisation d'un modèle de la source glottique en utilisant la décomposition modale empirique et les algorithmes génétiques. Nous utilisons deux indices acoustiques pour quantifier les dyspériodicités vocales dans le signal de parole. Le premier indice est le rapport excitation à dyspériodicité segmental (EDRSEG). Il est inspiré de la définition de l'indice conventionnel rapport signal à dysperiodicité segmental. Le deuxième indice est le quotient d'ouverture moyen (MOQ). Les méthodes d’analyse proposées sont appliquées à un corpus de voyelles [a] synthétiques et un corpus de la parole naturelle produite par des locuteurs normophoniques et dysphoniques et comprenant une large gamme de pathologies. Afin d’améliorer davantage les performances de la méthode d’analyse proposée, nous avons utilisé une analyse multivariée en combinant la proéminence du pic cepstral et le quotient d'ouverture moyen. La combinaison des deux indices acoustiques améliore la performance de la méthode d’estimation des dyspériodicités vocales en termes de corrélation entre l’indice acoustique et l’évaluation perceptive.