Machine Learning Approaches for Imbalanced Data: Click-Through Rate Prediction and Click Fraud Detection
fr
Loading...
Authors
Files
Collections
Journal Title
Journal ISSN
Volume Title
Publisher
Université Mohamed V, Faculté des Sciences ,Rabat
Department
Supervisor
Date
Abstract
Cette thèse de recherche aborde les défis importants posés par les ensembles de
données déséquilibrés dans le domaine de la publicité, en se concentrant sur la prédiction
du taux de clics (CTR) et la détection de la fraude au clic. Elle explore l’impact du
déséquilibre des données sur la prédiction du CTR, révélant comment cela affecte la précision
prédictive et identifiant les caractéristiques clés essentielles pour la précision. L’étude
se penche également sur le développement d’algorithmes avancés pour une détection optimisée
de la fraude au clic, en employant des techniques d’apprentissage automatique
comme XGBoost et des méthodes d’ensemble. Mettant l’accent sur la praticité et la reproductibilité,
la recherche intègre un traitement approfondi des données et des méthodologies
robustes adaptées aux applications du monde réel. Cette approche complète améliore non
seulement la compréhension du déséquilibre des données dans la publicité, mais fournit
également des solutions pratiques pour une prédiction efficace du CTR et la détection
de la fraude au clic. La thèse se conclut avec des perspectives d’avenir, plaidant pour
des recherches continues sur les considérations éthiques, le suivi des performances à long
terme, la sélection avancée des caractéristiques et la détection de la fraude en temps réel,
dans le but d’élargir l’applicabilité de ces résultats à d’autres domaines.
Description
Keywords
Mathématiques Appliquées et Informatiques, Machine Learning, Données déséquilibrées, Taux de clics (CTR), Fraude au clic, Publicité, Apprentissage automatique