Introduction de l'énergie et de la vitesse d'élocution dans un modèle de reconnaissance automatique de la parole

dc.contributor.authorYousfi, Abdellah
dc.date.accessioned2010-08-19T14:51:10Z
dc.date.accessioned2026-01-27T09:57:00Z
dc.date.available2010-08-19T14:51:10Z
dc.date.issued2001-06-19
dc.description.abstractLes modèles de Markov cachés (MMC) restent avec succès, les modèles les plus utilisés en reconnaissance automatique de la parole. Leur utilisation nécessite la construction d’une manière hiérarchique, d’un réseau en utilisant les connaissances de tous les niveaux. Au niveau phonétique chaque mot est représenté par une suite d’unités phonétiques élémentaires. Un modèle MMC est ensuite associé à chacune de ces unités pour donner le réseau acoustique global. Une des faiblesses des MMC standard est que les observations sont traitées à un seul niveau : le niveau acoustique. Or l’énergie et la durée sont des paramètres qui dépendent aussi du niveau phonétique. Afin de donner une modélisation (plus précise et plus simple) des paramètres qui dépendent du niveau phonétique, nous avons proposé un nouveau modèle à deux niveaux basé sur un pré-traitement centiseconde du signal de parole. Ce modèle est nommé Semi Modèle de Markov Caché à deux niveaux Centiseconde. Comme application de ce modèle nous avons étudié les cas de l’introduction de l’énergie et/ou la durée au niveau phonétique dans le modèle MMC. Dans la deuxième partie de cette thèse, nous avons étudié l’influence de l’introduction de la vitesse d’élocution dans le modèle TLHMM centiseconde (développé par Meziane). Deux alternatives sont envisagées. La première consiste à introduire la vitesse d’élocution en cours de reconnaissance en utilisant les filtres de Kalman, par contre la deuxième tient compte de ce facteur dans une espace de post-traitement. Ces approches sont évaluées sur un vocabulaire qui se comporte de 20 chiffres de 0 à 19, extrait de la base de données (BDSONS). Les résultats obtenus lors des tests de reconnaissance montrent l’intérêt de l’introduction de l’énergie et de la vitesse d’élocution dans les modèles de reconnaissance de la parole.en
dc.description.collaboratorDaoudi, E. M. (Président)
dc.description.collaboratorAddou, A. (Examinateur)
dc.description.collaboratorMeziane, A. (Examinateur)
dc.description.collaboratorNait Cherif, H. (Examinateur)
dc.description.collaboratorObrecht, R. A. (Examinateur)
dc.description.laboratoireInformatique, (LAB.)
dc.format.extent22016 bytes
dc.format.mimetypeapplication/msword
dc.identifier.urihttps://toubkal.imist.ma/handle/123456789/6471
dc.language.isofren
dc.publisherUniversité Mohamed 1er, Faculté Des Sciences, Oujdaen
dc.relation.ispartofseriesTh-006.454/YOU
dc.subjectMathématiqueen
dc.subjectInformatiqueen
dc.subjectAnalyse numériqueen
dc.subjectReconnaissance automatique de la paroleen
dc.subjectModèle de Markov cachéen
dc.subjectSemi modèle de Markov cachéen
dc.subjectNiveau centisecondeen
dc.subjectVitesse d'élocutionen
dc.titleIntroduction de l'énergie et de la vitesse d'élocution dans un modèle de reconnaissance automatique de la paroleen

Files