Vers un Deep Learning Système de Détection des Fraudes sur cartes bancaires

en
Loading...
Thumbnail Image

Journal Title

Journal ISSN

Volume Title

Publisher

Université Mohamed V, Faculté des Sciences ,Rabat

Department

Supervisor

Date

Abstract

L’objectif de cette thèse est d’apporter des contributions significatives à la recherche scientifique en proposant de nouvelles approches de machine learning visant à améliorer la détection des fraudes sur cartes bancaires. Elle aborde principalement les défis complexes auxquels est confronté un système de détection de fraudes en mettant l’accent sur le problème de déséquilibre des classes, la définition du contexte d’achat frauduleux à partir des données historiques et l’exploitation des informations pertinentes pour la tâche de classification en utilisant les mécanismes d’attention. Tout d’abord, les données sur les transactions par carte de crédit souffrent d’un fort déséquilibre vu que le nombre des transactions frauduleuses est beaucoup plus réduit que celui des transactions légitimes (moins de 1% des transactions sont frauduleuses). Nous proposons dans cette thèse une nouvelle méthode de ré-échantillonnage qui consiste à générer de nouvelles données, à partir d’une classe minoritaire d’un dataset, en se basant sur la méthode de clustering k-Means et l’algorithme génétique. Par ailleurs, les attributs décrivant une transaction bancaire ignorent les informations séquentielles qui se sont avérées très pertinentes pour la définition des comportements d’achat et des stratégies de fraudes. Dans cette thèse, nous avons montré que la capturation de l’historique des achats à partir de données séquentielles en utilisant les réseaux de neurones récurrents LSTM, a conduit à une amélioration significative de la prédiction des fraudes sur cartes bancaires. Ensuite, nous avons utilisé les mécanismes d’attention pour améliorer les performances des réseaux de neurones récurrents en se focalisant sur les informations pertinentes à la tâche de classification. Enfin, nous avons exploré un nouveau modèle de deep learning pour la définition du comportement d’achat frauduleux en se basant sur l’approche PV-DM (Paragraph Vector-Distributed Memory). Les résultats obtenus révèlent que l’utilisation du modèle PV-DM permet d’obtenir de bonnes performances et est considéré plus robuste et plus simple que le modèle LSTM couramment utilisé pour le traitement séquentiel des données. En conclusion, ces travaux permettent de considérer les connaissances contextuelles dans le cadre de la détection de fraudes par carte de crédit afin d’améliorer la tâche de classification. Les méthodes proposées peuvent être étendues à toute tâche supervisée comportant des datasets déséquilibrés ou séquentiels.

Description

Keywords

Sécurité Informatique, Machine Learning, Big Data, Fraud detection, Deep Learning, Imbalanced datasets, Sequence learning, Attention mechanism, PV-DM

Citation