Reconnaissance des scènes vidéo pour adultes
fr
Loading...
Authors
Collections
Journal Title
Journal ISSN
Volume Title
Publisher
Université Mohammed V - Agdal, Faculté des Sciences, Rabat
Department
Supervisor
Date
Abstract
La détection de la peau consiste à détecter les pixels de peau dans une image couleur pour
obtenir une image binaire. Elle constitue une étape de prétraitement fondamentale dans
plusieurs applications telles que la détection de visage, la segmentation vidéo, le filtrage des
images sur le Web et la reconnaissance des scènes vidéo pour adultes. Cependant, c’est une
tâche difficile à réaliser à cause de la variation de la couleur de la peau (européenne,
africaine, etc.) et la diversité des conditions de prise de vue (lumière, bruit, ...) qui créent une
classe de la peau avec beaucoup de variations inter-classe.
Dans l’objectif de surmonter ces dernières contraintes nos travaux de thèses consiste à
définir un modèle robuste de la distribution de la peau basé sur la fusion des différentes
espaces de couleurs. La fusion de classificateurs, a été proposée comme une voie de
recherche permettant de fiabiliser la détection en utilisant la complémentarité qui peut exister
entre les trois classificateurs. Ensuite, nous avons proposé d’utiliser les informations de
mouvement présentes dans la séquence. En effet, le mouvement apparent des pixels est
généralement continu au cours du temps.
L’utilisation de l’information de mouvement peut être un moyen simple pour mettre en
oeuvre une technique rapide de détection de peau dans une vidéo. Cette catégorie de
systèmes suppose généralement que l’arrière plan de la scène vidéo est stationnaire et que les
régions contenant la peau tels que le visage ou/et les mains par exemple sont en mouvement.
Dans ce cas, ces régions peuvent être détectées par une simple différence entre l’image
courante et l’image précédente. Il semble évident que les hypothèses retenues sont trop
fortes. C’est pourquoi l’information de mouvement n’est jamais utilisée seule pour la
détection. On la trouve utilisée conjointement avec l’information de couleur de peau.
L’exploitation de l’information de mouvement oriente la détection de peau vers des zones
préférentielles en éliminant les zones sans intérêt et permet donc une forte réduction de la complexité de la détection et par conséquent une limitation importante des calculs et des
traitements.
Ensuite, une vérification de la présence ou pas d’un visage dans la scène ne peut être que très
bénéfique. Cette étape permettra au système de détourner l’opération de reconnaissance si la
scène ne contient aucun visage. On se base donc sur un vote majoritaire selon le nombre de
visages dans les différents frames de la vidéo à analyser. Notre méthode se révèle être en
mesure de déterminer et de distinguer efficacement les vidéos à caractère illicite en intégrant
la caractéristique de la forme associée à la détection de visage. Cependant, si le nombre de
visages dominant dans la vidéo appartient à l’intervalle [1 4], on conclu que cette vidéo peut
bien être une vidéo adulte.
Pour augmenter les performances de notre démarche on a proposé de compléter le
prétraitement en éliminant les images qui présentent des gens avec des costumes de natation.
Une manière possible pour traiter ce problème est de créer une méthode d'identification
d'objet pour la région peu sûre supérieure qui identifierait la différence entre un corps d'une
femme et celle d’un homme. Cette méthode consiste tout d’abord à calculer le nombre de régions de peau dans les images de la vidéo, puis on procède à séparer les régions et en
extraire différentes informations, en vérifiant un ensemble de contraintes qui sont aux
nombres de deux. L’une concerne le ratio et l’inclination θ de la région et l'autre concerne sa
surface, habituellement, dans le cas des organes adultes, ces contraintes ne dépassent pas un
certain intervalle, donc tous les segments qui ont un ratio, une inclination et une surface qui
ne fait pas partie de cet intervalle seront éliminés.
Une phase de prise de décision consiste à calculer des descripteurs qui caractérisent les images pour adultes de la scène sur les zones détectées de la peau. Elle permet d’affecter la
probabilité d’appartenance d'une image à l’une des deux classes : Adulte ou non adulte. Un
pourcentage de peau élevé correspond à une image qui sera classifiée pour adulte. Tous ces
descripteurs composent un vecteur de fonction simple qui sera pris en considération pour
prendre notre décision. Cette phase peut être accomplie par plusieurs modèles (arbres,
réseaux de neurones (ANN), SVM...).
Il n’existe pas une règle générale pour choisir le meilleur classificateur pour une application
donnée. Pour cela, le choix entre ces classificateurs se fait d’une manière empirique en
utilisant les résultats de classification comme critère de performance. A cette fin, nous avons
présenté une étude comparative entre les deux classificateurs ANN et SVM en termes de
taux de bonne reconnaissance et on a conclu que la méthode SVM avec noyau gaussien est
celle qui donne les meilleurs résultats.
Description
Keywords
Sciences de l’Ingénieur, Informatique, Télécommunications, Détection de la peau, Détection de mouvement, Visage, Réseau de neurone, SVM, Image adulte, Filtrage vidéo