Vers un Deep Learning Système de Détection des Fraudes sur cartes bancaires
en
Loading...
Authors
Files
Collections
Journal Title
Journal ISSN
Volume Title
Publisher
Université Mohamed V, Faculté des Sciences ,Rabat
Department
Supervisor
Date
Abstract
L’objectif de cette thèse est d’apporter des contributions significatives à la recherche scientifique
en proposant de nouvelles approches de machine learning visant à améliorer la détection des
fraudes sur cartes bancaires. Elle aborde principalement les défis complexes auxquels est confronté
un système de détection de fraudes en mettant l’accent sur le problème de déséquilibre des classes,
la définition du contexte d’achat frauduleux à partir des données historiques et l’exploitation des
informations pertinentes pour la tâche de classification en utilisant les mécanismes d’attention.
Tout d’abord, les données sur les transactions par carte de crédit souffrent d’un fort déséquilibre
vu que le nombre des transactions frauduleuses est beaucoup plus réduit que celui des transactions
légitimes (moins de 1% des transactions sont frauduleuses). Nous proposons dans cette
thèse une nouvelle méthode de ré-échantillonnage qui consiste à générer de nouvelles données, à
partir d’une classe minoritaire d’un dataset, en se basant sur la méthode de clustering k-Means et
l’algorithme génétique.
Par ailleurs, les attributs décrivant une transaction bancaire ignorent les informations séquentielles
qui se sont avérées très pertinentes pour la définition des comportements d’achat et des
stratégies de fraudes. Dans cette thèse, nous avons montré que la capturation de l’historique des
achats à partir de données séquentielles en utilisant les réseaux de neurones récurrents LSTM, a
conduit à une amélioration significative de la prédiction des fraudes sur cartes bancaires. Ensuite,
nous avons utilisé les mécanismes d’attention pour améliorer les performances des réseaux de
neurones récurrents en se focalisant sur les informations pertinentes à la tâche de classification.
Enfin, nous avons exploré un nouveau modèle de deep learning pour la définition du comportement
d’achat frauduleux en se basant sur l’approche PV-DM (Paragraph Vector-Distributed
Memory). Les résultats obtenus révèlent que l’utilisation du modèle PV-DM permet d’obtenir de
bonnes performances et est considéré plus robuste et plus simple que le modèle LSTM couramment
utilisé pour le traitement séquentiel des données.
En conclusion, ces travaux permettent de considérer les connaissances contextuelles dans le
cadre de la détection de fraudes par carte de crédit afin d’améliorer la tâche de classification. Les
méthodes proposées peuvent être étendues à toute tâche supervisée comportant des datasets déséquilibrés
ou séquentiels.
Description
Keywords
Sécurité Informatique, Machine Learning, Big Data, Fraud detection, Deep Learning, Imbalanced datasets, Sequence learning, Attention mechanism, PV-DM