Système de reconnaissance automatique de l'Amazighe et analyse des formants pour le diagnostic vocal
fr
Loading...
Authors
Collections
Journal Title
Journal ISSN
Volume Title
Publisher
Université Sidi Mohamed Ben Abdellah, Faculté des Sciences - Dhar El Mahraz -, Fès
Department
Supervisor
Date
Abstract
La parole est la forme la plus naturelle de la communication humaine. Elle est délectable,
déchiffrée et par conséquent reconnue. La reconnaissance automatique de la parole (RAP) est
faisable grâce à des systèmes bien développés. Il s’agit d’une méthode de décodage du signal
vocal capturé par le microphone pour le convertir ensuite en mots. Cette technologie est entrain
de connaitre une grande évolution non seulement dans les domaines industriels et publics où ces
techniques intègrent les appareils électroniques utilisés quotidiennement, mais aussi dans
d’autres domaines tels que l'éducation, le médical, le militaire, etc. L’objectif de cette thèse est la
réalisation des systèmes de reconnaissance et de diagnostic basant sur les formalismes
statistiques Markovien pour modéliser les mots prononcés à base des unités phonétiques
élémentaires. Notre première système de la reconnaissance était créé pour reconnaitre les
locuteurs fumeurs via utilisation les techniques et les algorithmes de la reconnaissance
automatique de la parole. Pour bien confirmer notre étude, nous avons examiné la voix humaine
de 40 adultes (20 fumeurs et 20 non-fumeurs) afin de déterminer les effets du tabagisme sur les
paramètres vocaux humain en s’appuyant sur 3 voyelles de la langue Amazighe (A, I, U). Après
avoir acquis des résultats favorables concernant le diagnostic des fumeurs, nous avons
commencé à construire un deuxième système de reconnaissance automatique de la parole
permettant de diagnostiquer la parole des personnes atteintes de troubles de voix. Ce projet de
recherche est réalisé en langue Amazighe. Son objectif est de distinguer entre les voix normales,
celle des fumeurs et pathologiques. Afin de développer un système au milieu réel, nous avons
étudié l’effet du bruit sur les dix premiers chiffres Amazighs dans des conditions bruyantes d'un
point de vue RAP basé sur le rapport signal sur bruit en anglais signal-to-noise ratio (SNR). Nos
expériences de tests ont été réalisées sous deux types de bruits et répétées avec un bruit
environnemental supplémentaire avec différents rapports SNR pour chaque type allant de 5 dB à
45 dB. Les performances de nos systèmes ont été mesurées en utilisant des combinaisons des
états MMC avec des distributions de mélange gaussiennes. Nos résultats obtenus sont très
satisfaisants.
Description
Keywords
Informatique, Reconnaissance automatique de la parole, Intelligence artificielle, Modèle de Markov caché, Algorithme de Viterbi, GMM, MFCC, Langue amazighe, Locuteur fumeur, Trouble de la voix