Contributions au prétraitement de données : Élimination du bruit de classe et réduction de dimension
fr
Loading...
Authors
Files
Collections
Journal Title
Journal ISSN
Volume Title
Publisher
Université Mohamed V, Faculté des Sciences, Rabat
Department
Supervisor
Date
Abstract
Les données dans le monde réel ont fortement augmenté et elles sont de plus en plus
sensibles aux bruits, aux valeurs manquantes et aux incohérences. La qualité des données
affecte les résultats de leur exploration. Afin d’aider `a améliorer la qualité des données
et faciliter le processus d’extraction d’informations, ces données doivent être prétraitées.
Le prétraitement des données est l’une des étapes les plus critiques dans un processus
d’exploration de données.
Notre attention s’est par cons´equent port´ee sur deux importantes phases de prétraitement : le nettoyage des données en éliminant le bruit de classe et la réduction de la
dimension en utilisant une méthode de sélection d’attributs.
Deux contributions ont ´et´e propos´ees pour la d´détection et l’élimination de bruit de classe
dans cette thèse. La première est une architecture distribuée permettant la d´détection et
l’élimination de bruit de classe. La deuxième est une approche basée sur un filtre nommé
Multi-Itérative Partitioning Class Noise Filter (MIPCNF) permettant la détection de
bruit de classe de mani`ere it´erative. En effet, ce filtre repose sur un algorithme dans
lequel plusieurs tours de d´détection de bruit sont effectuées pour chaque sous ensemble
de données en utilisant un ensemble de classifieurs.
Une troisième contribution pour la réduction de dimension a été proposée. Il s’agit
d’un nouveau Framework, appelée Horizo-Vertical Distributed Feature Selection Approach (HVDFS) , permettant la sélection d’attributs de manière distribuée horizontalement et verticalement. Cela permet d’améliorer la qualité de la classification tout en
réduisant le nombre d’attributs.
Description
Keywords
Sciences de l’ingénieur, Informatique, Télécommunications, Data Mining, Prétraitement des données, Nettoyage ´ des données, Elimination de bruit de classe, Réduction de dimension, Sélection d’attribut