Machine Learning Approaches for Imbalanced Data: Click-Through Rate Prediction and Click Fraud Detection

fr
Loading...
Thumbnail Image

Journal Title

Journal ISSN

Volume Title

Publisher

Université Mohamed V, Faculté des Sciences ,Rabat

Department

Supervisor

Date

Abstract

Cette thèse de recherche aborde les défis importants posés par les ensembles de données déséquilibrés dans le domaine de la publicité, en se concentrant sur la prédiction du taux de clics (CTR) et la détection de la fraude au clic. Elle explore l’impact du déséquilibre des données sur la prédiction du CTR, révélant comment cela affecte la précision prédictive et identifiant les caractéristiques clés essentielles pour la précision. L’étude se penche également sur le développement d’algorithmes avancés pour une détection optimisée de la fraude au clic, en employant des techniques d’apprentissage automatique comme XGBoost et des méthodes d’ensemble. Mettant l’accent sur la praticité et la reproductibilité, la recherche intègre un traitement approfondi des données et des méthodologies robustes adaptées aux applications du monde réel. Cette approche complète améliore non seulement la compréhension du déséquilibre des données dans la publicité, mais fournit également des solutions pratiques pour une prédiction efficace du CTR et la détection de la fraude au clic. La thèse se conclut avec des perspectives d’avenir, plaidant pour des recherches continues sur les considérations éthiques, le suivi des performances à long terme, la sélection avancée des caractéristiques et la détection de la fraude en temps réel, dans le but d’élargir l’applicabilité de ces résultats à d’autres domaines.

Description

Keywords

Mathématiques Appliquées et Informatiques, Machine Learning, Données déséquilibrées, Taux de clics (CTR), Fraude au clic, Publicité, Apprentissage automatique

Citation