Extraction de caractéristiques et apprentissage automatique pour la reconnaissance d’émotions humaines
fr
Loading...
Authors
Collections
Journal Title
Journal ISSN
Volume Title
Publisher
Université Sidi Mohamed Ben Abdellah, Faculté des Sciences et Technique - Saïs- , Fès
Department
Supervisor
Date
Abstract
La reconnaissance automatique des expressions faciales est devenue une technologie cruciale dans le domaine de la vision par ordinateur et ses applications, notamment l’identification et la sécurité, la médecine et la surveillance. Le travail de cette thèse concerne le
développement d’un système de reconnaissance des expressions faciales universelles, comme
l’expression neutre, le dégoût, la peur, la joie, la tristesse, la colère et la surprise, dans des
vidéos du monde réel contenant des visages. Pour y arriver, nous proposons un algorithme
pour analyser les images en utilisant des descripteurs d’image et des classifieurs. Cependant,
l’ajustement de ces méthodes n’est pas un processus facile à effectuer manuellement. Alors
pour éviter l’étape de configuration manuelle des descripteurs et des classifieurs, nous proposons un algorithme exécutant les différentes étapes de la chaîne de traitement vers une
analyse entièrement automatisée des images.
Ensuite, en se basant sur le résultat d’analyse des images, nous proposons un nouveau
pipeline pour reconnaître les expressions universelles de plus d’une personne dans des vidéos du monde réel. Le pipeline utilise le modèle d’analyse optimal, renvoyé par l’algorithme
d’analyse de données, qui se compose du descripteur HOG et du classifieur LDA. Pour amé-
liorer le classifieur, une analyse de la structure des données a été réalisée en exploitant le
pipeline. Cela, en testant et évaluant des fonctions séparatrices linéaires et non-linéaires sur
les clusters de données pendant l’entraînement du classifieur.
Pour mener notre expérimentation, nous avons utilisé la base de données CK+. Une évaluation automatisée correspondant à la cadence vidéo est proposée, où des vidéos étiquetées
de la base de données MMI sont utilisées pour étudier la pertinence du pipeline dans des
conditions réelles. Les résultats du pipeline ont montré que l’utilisation du descripteur HOG
et l’algorithme d’apprentissage LDA donne un taux de reconnaissance élevé de 94,66 % en
moyenne. Il convient de noter que le pipeline proposé atteint un temps de traitement moyen
de 0,018 secondes, sans nécessiter aucun dispositif qui accélère le traitement de l’image.
Description
Keywords
Traitement d'images, Informatique, Extraction de caractéristique, Apprentissage automatique, Reconnaissance d’émotions humaines