Introduction de l'énergie et de la vitesse d'élocution dans un modèle de reconnaissance automatique de la parole

Yousfi, Abdellah

Introduction de l'énergie et de la vitesse d'élocution dans un modèle de reconnaissance automatique de la parole

dc.contributor.author	Yousfi, Abdellah
dc.date.accessioned	2010-08-19T14:51:10Z
dc.date.accessioned	2026-01-27T09:57:00Z
dc.date.available	2010-08-19T14:51:10Z
dc.date.issued	2001-06-19
dc.description.abstract	Les modèles de Markov cachés (MMC) restent avec succès, les modèles les plus utilisés en reconnaissance automatique de la parole. Leur utilisation nécessite la construction d’une manière hiérarchique, d’un réseau en utilisant les connaissances de tous les niveaux. Au niveau phonétique chaque mot est représenté par une suite d’unités phonétiques élémentaires. Un modèle MMC est ensuite associé à chacune de ces unités pour donner le réseau acoustique global. Une des faiblesses des MMC standard est que les observations sont traitées à un seul niveau : le niveau acoustique. Or l’énergie et la durée sont des paramètres qui dépendent aussi du niveau phonétique. Afin de donner une modélisation (plus précise et plus simple) des paramètres qui dépendent du niveau phonétique, nous avons proposé un nouveau modèle à deux niveaux basé sur un pré-traitement centiseconde du signal de parole. Ce modèle est nommé Semi Modèle de Markov Caché à deux niveaux Centiseconde. Comme application de ce modèle nous avons étudié les cas de l’introduction de l’énergie et/ou la durée au niveau phonétique dans le modèle MMC. Dans la deuxième partie de cette thèse, nous avons étudié l’influence de l’introduction de la vitesse d’élocution dans le modèle TLHMM centiseconde (développé par Meziane). Deux alternatives sont envisagées. La première consiste à introduire la vitesse d’élocution en cours de reconnaissance en utilisant les filtres de Kalman, par contre la deuxième tient compte de ce facteur dans une espace de post-traitement. Ces approches sont évaluées sur un vocabulaire qui se comporte de 20 chiffres de 0 à 19, extrait de la base de données (BDSONS). Les résultats obtenus lors des tests de reconnaissance montrent l’intérêt de l’introduction de l’énergie et de la vitesse d’élocution dans les modèles de reconnaissance de la parole.	en
dc.description.collaborator	Daoudi, E. M. (Président)
dc.description.collaborator	Addou, A. (Examinateur)
dc.description.collaborator	Meziane, A. (Examinateur)
dc.description.collaborator	Nait Cherif, H. (Examinateur)
dc.description.collaborator	Obrecht, R. A. (Examinateur)
dc.description.laboratoire	Informatique, (LAB.)
dc.format.extent	22016 bytes
dc.format.mimetype	application/msword
dc.identifier.uri	https://toubkal.imist.ma/handle/123456789/6471
dc.identifier.uri	https://doi.org/10.83129/toubkal-23562
dc.language.iso	fr	en
dc.publisher	Université Mohamed 1er, Faculté Des Sciences, Oujda	en
dc.relation.ispartofseries	Th-006.454/YOU
dc.subject	Mathématique	en
dc.subject	Informatique	en
dc.subject	Analyse numérique	en
dc.subject	Reconnaissance automatique de la parole	en
dc.subject	Modèle de Markov caché	en
dc.subject	Semi modèle de Markov caché	en
dc.subject	Niveau centiseconde	en
dc.subject	Vitesse d'élocution	en
dc.title	Introduction de l'énergie et de la vitesse d'élocution dans un modèle de reconnaissance automatique de la parole	en

Collections

Faculté des Sciences - Oujda

Introduction de l'énergie et de la vitesse d'élocution dans un modèle de reconnaissance automatique de la parole

Files

Collections