Détection du fondamental de la parole en temps réel : application aux voix pathologiques

fr
Loading...
Thumbnail Image

Journal Title

Journal ISSN

Volume Title

Publisher

Université Mohammed V - Agdal, Faculté des Sciences, Rabat

Department

Supervisor

Abstract

Cette thèse s'inscrit dans le cadre des travaux de recherche qui visent la détermination de la fréquence fondamentale du signal de parole. La première contribution consiste en le développement des algorithmes de détection de pitch en temps réel à partir d'une auto-corrélation circulaire du signal d'excitation glottique. Parmi tous les algorithmes de détection du pitch, décrits dans la littérature, rares sont ceux qui peuvent résoudre correctement tous les problèmes liés au suivi du contour du pitch. Pour cette raison, nous avons élargi notre champ d'investigation et avons proposé de nouveaux algorithmes fondés sur la transformation en ondelettes. Pour évaluer les performances des algorithmes proposés, nous avons utilisé deux bases de données : Bagshaw et Keele. Les résultats que nous avons obtenus montrent clairement que nos algorithmes surclassent les meilleurs algorithmes de référence décrits dans la littérature. La deuxième contribution de cette thèse concerne la réalisation d'un système de conversion de voix dans le but d'améliorer la voix pathologique. Nous parlons dans ce cas d'un système de correction de voix. Notre principal apport, concernant la conversion vocale, consiste en la prédiction des coefficients cepstraux de Fourier relatifs au signal d'excitation glottique. Grâce à ce nouveau type de prédiction, nous avons pu réaliser des systèmes de conversion de voix dont les résultats, qu'ils soient objectifs ou subjectifs, valident l'approche proposée.

Description

Keywords

Sciences de l'ingénieur, Informatique, Télécommunications, Fréquence fondamentale, Période de pitch, Auto-corrélation circulaire, Transformation en ondelettes, Correction de voix

Citation