Reconnaissance automatique du locuteur par des GMM à grande marge
fr
Loading...
Authors
Collections
Journal Title
Journal ISSN
Volume Title
Publisher
Université Mohammed V - Agdal, Faculté des Sciences, Rabat
Department
Supervisor
Date
Abstract
Depuis plusieurs dizaines d'années, la reconnaissance automatique du locuteur (RAL) fait l'objet
de travaux de recherche entrepris par de nombreuses équipes dans le monde. La majorité des
systèmes actuels sont basés sur l'utilisation des Modèles de Mélange de lois Gaussiennes (GMM)
et/ou des modèles discriminants SVM, i.e., les machines à vecteurs de support. Nos travaux ont
pour objectif général la proposition d'utiliser de nouveaux modèles GMM à grande marge pour la
RAL qui soient une alternative aux modèles GMM génératifs classiques et l'approche
discriminante état de l'art GMM-SVM. Nous appelons ces modèles LM-dGMM pour Large Margin
diagonal GMM. Nos modèles reposent sur une récente technique discriminante pour la séparation
multi-classes, qui a été appliquée en reconnaissance de la parole. Exploitant les propriétés des
systèmes GMM utilisés en RAL, nous présentons dans cette thèse des variantes d'algorithmes
d'apprentissage discriminant des GMM minimisant une fonction de perte à grande marge. Des
tests effectués sur les tâches de reconnaissance du locuteur de la campagne d'évaluation NIST-SRE
2006 démontrent l'intérêt de ces modèles en reconnaissance
Description
Keywords
Reconnaissance automatiqueSciences de l'Ingénieur, Informatique, Télécommunications, Loi Gaussienne, Reconnaissance du locuteur