Introduction de la durée des sons dans un modèle de Markov caché au niveau supra segmental
fr
Loading...
Authors
Collections
Journal Title
Journal ISSN
Volume Title
Publisher
Université Mohamed 1er, Faculté Des Sciences, Oujda
Department
Supervisor
Date
Abstract
Dans le cadre de la reconnaissance automatique de la parole, les modèles de Markov cachés (MMC) sont les plus utilisés. Leur application nécessite la construction, d’une manière hiérarchique, d’un réseau probabiliste en utilisant les connaissances de tous les niveaux. Au niveau phonétique, chaque mot est représenté par une séquence d’unités phonétiques élémentaires. Le réseau acoustique global est obtenu en associant à chacune de ces unités un modèle acoustique.
Une des limitations des MMC standards est que les observations sont traitées à un seul niveau hiérarchique : le niveau acoustique. Or la durée des sons est un paramètre qui dépend de tous les niveaux linguistiques en particulier du niveau phonétique. Ces modèles ne permettent pas une prise en compte satisfaisante de l’information de durée.
Dans le but de réaliser une modélisation plus précise de la durée des sons, nous avons développé un modèle à deux niveaux basé sur un prétraitement centiseconde du signal de parole. Ce modèle introduit les représentations spectrales et phonétiques à deux niveaux hiérarchiques différents.
Description
Keywords
Mathématique, Reconnaissance automatique de la parole, Modèle de Markov caché, Algorithme de Viterbi, Durée des sons