Machine Learning Approaches for Imbalanced Data: Click-Through Rate Prediction and Click Fraud Detection

Nadir Sahllal

Machine Learning Approaches for Imbalanced Data: Click-Through Rate Prediction and Click Fraud Detection

fr

Authors

Nadir Sahllal

Files

these-fsr.pdf (2.12 MB)

Collections

Faculté des Sciences - Rabat

Publisher

Université Mohamed V, Faculté des Sciences ,Rabat

URI

https://toubkal.imist.ma/handle/123456789/34212
https://doi.org/10.83129/toubkal-14731

Date

2023

Abstract

Cette thèse de recherche aborde les défis importants posés par les ensembles de données déséquilibrés dans le domaine de la publicité, en se concentrant sur la prédiction du taux de clics (CTR) et la détection de la fraude au clic. Elle explore l’impact du déséquilibre des données sur la prédiction du CTR, révélant comment cela affecte la précision prédictive et identifiant les caractéristiques clés essentielles pour la précision. L’étude se penche également sur le développement d’algorithmes avancés pour une détection optimisée de la fraude au clic, en employant des techniques d’apprentissage automatique comme XGBoost et des méthodes d’ensemble. Mettant l’accent sur la praticité et la reproductibilité, la recherche intègre un traitement approfondi des données et des méthodologies robustes adaptées aux applications du monde réel. Cette approche complète améliore non seulement la compréhension du déséquilibre des données dans la publicité, mais fournit également des solutions pratiques pour une prédiction efficace du CTR et la détection de la fraude au clic. La thèse se conclut avec des perspectives d’avenir, plaidant pour des recherches continues sur les considérations éthiques, le suivi des performances à long terme, la sélection avancée des caractéristiques et la détection de la fraude en temps réel, dans le but d’élargir l’applicabilité de ces résultats à d’autres domaines.

Keywords

Mathématiques Appliquées et Informatiques, Machine Learning, Données déséquilibrées, Taux de clics (CTR), Fraude au clic, Publicité, Apprentissage automatique

Full item page

Machine Learning Approaches for Imbalanced Data: Click-Through Rate Prediction and Click Fraud Detection

Authors

Files

Collections

Journal Title

Journal ISSN

Volume Title

Publisher

Department

Supervisor

URI

Date

Abstract

Description

Keywords

Citation

Endorsement

Review

Supplemented By

Referenced By