reconnaissance  automatique  de  la  parole : application  aux dialectes marocains

Le traitement automatique de la parole suscite actuellement un grand intérêt vu le besoin de communiquer avec les machines en utilisant la parole spontanée. Ce domaine est riche d’applications potentielles allant de la transcription automatique des signaux de la parole à l’indexation des documents audiovisuels. Aussi, le traitement des différents dialectes mondiaux constitue une branche importante de la reconnaissance automatique de la parole et permet par la suite la généralisation des systèmes de dialogue homme-machines. Cette thèse s’inscrit dans le cadre de traitement automatique de la parole qui se focalise particulièrement sur la Reconnaissance Automatique de la Parole (RAP) et la Vérification Automatique du Locuteur (VAL). En particulier, on s’intéresse aux deux dialectes marocains Darija et Tamazight qui constituent les ̏ langues ̎ les plus parlées au Maroc. L’objectif principal est de réaliser un système de sécurité composé de deux parties et exploitable au niveau national. La première phase de ce système consiste à vérifier des mots de passe en se basant sur la reconnaissance vocale. Néanmoins, cette approche n’est pas suffisamment robuste notamment pour l’accès aux données plus sensibles. Pour tenter de résoudre ce problème, une deuxième phase est nécessaire et consiste à ajouter une deuxième couche permettant l’identification automatique du locuteur. Dans le domaine de sécurité un tel système permet d’améliorer l’usage de l’identification à base des empreintes vocales. Pour tester les performances de l’ensemble de ces systèmes, nous avons utilisé une base de données orale pour les deux dialectes. Celle-ci a été créée au sein de notre laboratoire (laboratoire de Traitement de l’Information et Aide à la Décision). L’évaluation des résultats obtenus a été réalisée en se basant sur le calcul du taux de reconnaissance. Les meilleurs résultats ont été obtenus par les méthodes basées sur les modèles de Markov cachés (MMC) et les réseaux de neurones (RN).

Keywords

Modèle de Markov Caché (MMC), MFCC, Tifinaghe, Dialectes marocains, Tamazight, Darija, Vérification du locuteur, Réseaux de neurones, Sécurité.

Full item page

reconnaissance automatique de la parole : application aux dialectes marocains

Authors

Files

Collections

Journal Title

Journal ISSN

Volume Title

Publisher

Department

Supervisor

URI

Date

Abstract

Description

Keywords

Citation

Endorsement

Review

Supplemented By

Referenced By