Contributions au prétraitement de données : Élimination du bruit de classe et réduction de dimension

ZERHARI Btissam

Contributions au prétraitement de données : Élimination du bruit de classe et réduction de dimension

fr

Authors

ZERHARI Btissam

Files

these-fsr.pdf (2.29 MB)

Collections

Faculté des Sciences - Rabat

Publisher

Université Mohamed V, Faculté des Sciences, Rabat

URI

https://toubkal.imist.ma/handle/123456789/15211
https://doi.org/10.83129/toubkal-15022

Date

2020-10-31

Abstract

Les données dans le monde réel ont fortement augmenté et elles sont de plus en plus sensibles aux bruits, aux valeurs manquantes et aux incohérences. La qualité des données affecte les résultats de leur exploration. Afin d’aider `a améliorer la qualité des données et faciliter le processus d’extraction d’informations, ces données doivent être prétraitées. Le prétraitement des données est l’une des étapes les plus critiques dans un processus d’exploration de données. Notre attention s’est par cons´equent port´ee sur deux importantes phases de prétraitement : le nettoyage des données en éliminant le bruit de classe et la réduction de la dimension en utilisant une méthode de sélection d’attributs. Deux contributions ont ´et´e propos´ees pour la d´détection et l’élimination de bruit de classe dans cette thèse. La première est une architecture distribuée permettant la d´détection et l’élimination de bruit de classe. La deuxième est une approche basée sur un filtre nommé Multi-Itérative Partitioning Class Noise Filter (MIPCNF) permettant la détection de bruit de classe de mani`ere it´erative. En effet, ce filtre repose sur un algorithme dans lequel plusieurs tours de d´détection de bruit sont effectuées pour chaque sous ensemble de données en utilisant un ensemble de classifieurs. Une troisième contribution pour la réduction de dimension a été proposée. Il s’agit d’un nouveau Framework, appelée Horizo-Vertical Distributed Feature Selection Approach (HVDFS) , permettant la sélection d’attributs de manière distribuée horizontalement et verticalement. Cela permet d’améliorer la qualité de la classification tout en réduisant le nombre d’attributs.

Keywords

Sciences de l’ingénieur, Informatique, Télécommunications, Data Mining, Prétraitement des données, Nettoyage ´ des données, Elimination de bruit de classe, Réduction de dimension, Sélection d’attribut

Full item page

Contributions au prétraitement de données : Élimination du bruit de classe et réduction de dimension

Authors

Files

Collections

Journal Title

Journal ISSN

Volume Title

Publisher

Department

Supervisor

URI

Date

Abstract

Description

Keywords

Citation

Endorsement

Review

Supplemented By

Referenced By