reconnaissance automatique de la parole : application aux dialectes marocains
FR
Loading...
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Faculté des Sciences et des Techniques, Béni Mellal - Doctorat ou Doctorat National
Department
Supervisor
Date
Abstract
Le traitement automatique de la parole suscite actuellement un grand intérêt vu le
besoin de communiquer avec les machines en utilisant la parole spontanée. Ce domaine est
riche d’applications potentielles allant de la transcription automatique des signaux de la parole
à l’indexation des documents audiovisuels. Aussi, le traitement des différents dialectes
mondiaux constitue une branche importante de la reconnaissance automatique de la parole et
permet par la suite la généralisation des systèmes de dialogue homme-machines.
Cette thèse s’inscrit dans le cadre de traitement automatique de la parole qui se focalise
particulièrement sur la Reconnaissance Automatique de la Parole (RAP) et la Vérification
Automatique du Locuteur (VAL). En particulier, on s’intéresse aux deux dialectes marocains
Darija et Tamazight qui constituent les ̏ langues ̎ les plus parlées au Maroc. L’objectif
principal est de réaliser un système de sécurité composé de deux parties et exploitable au
niveau national. La première phase de ce système consiste à vérifier des mots de passe en se
basant sur la reconnaissance vocale. Néanmoins, cette approche n’est pas suffisamment
robuste notamment pour l’accès aux données plus sensibles. Pour tenter de résoudre ce
problème, une deuxième phase est nécessaire et consiste à ajouter une deuxième couche
permettant l’identification automatique du locuteur. Dans le domaine de sécurité un tel
système permet d’améliorer l’usage de l’identification à base des empreintes vocales.
Pour tester les performances de l’ensemble de ces systèmes, nous avons utilisé une base
de données orale pour les deux dialectes. Celle-ci a été créée au sein de notre laboratoire
(laboratoire de Traitement de l’Information et Aide à la Décision). L’évaluation des résultats
obtenus a été réalisée en se basant sur le calcul du taux de reconnaissance. Les meilleurs
résultats ont été obtenus par les méthodes basées sur les modèles de Markov cachés (MMC) et
les réseaux de neurones (RN).
Description
Keywords
Modèle de Markov Caché (MMC), MFCC, Tifinaghe, Dialectes marocains, Tamazight, Darija, Vérification du locuteur, Réseaux de neurones, Sécurité.