Haute Ecole
d'Ingénierie et de Gestion
du Canton de Vaud

Des autoencodeurs particuliers pour détecter les fraudes bancaires

mars 4, 2021, 08:30 by User Not Found

La fraude bancaire évolue au fil des ans. Le nombre de fraudeurs est en augmentation ainsi que leurs compétences et leur ingéniosité pour vider des comptes bancaires ou acheter des marchandises avec des copies de cartes de crédit. La multiplicité des canaux permet au client d’accéder aux services bancaires via différentes interfaces.

Selon Juniper Research, le nombre de personnes utilisant des applications bancaires mobiles approche deux milliards, soit environ 40 % de la population adulte mondiale. Du point de vue des banques, les plates-formes bancaires électroniques, les smartphones et les smartwatches, les services bancaires ouverts, etc. sont des portes d'entrée pour les fraudeurs.

Selon une étude de PricewaterhouseCoopers (PwC), le coût de la fraude en 2020 représente plus de 40 milliards de dollars. A titre d’illustration, les attaques d'ingénierie sociale (social engineering) et de phishing ont représenté 166'000 plaintes dans le monde entre juin 2016 et juillet 2019, pour un coût total de 26 milliards de dollars, selon le FBI. Ce coût, associé à la perte de réputation causée par chaque cas de fraude, devient insoluble pour les institutions financières et le besoin d'outils appropriés de détection des fraudes s'accroît.

NetGuardians, une start-up issue de la HEIG-VD, ayant obtenu plusieurs récompenses prestigieuses, aidant des institutions financières à combattre les fraudes dans plus de 30 pays et une partie de l'équipe du Prof. Stephan Robert-Nicoud, de la HEIG-VD, possédant une grande expérience dans la collaboration avec plusieurs entreprises suisses sur des technologies de pointe, ont mené un premier projet de recherche financé par Innosuisse entre 2017 et 2019, avec une dizaine de chercheurs. Dans ce cadre, des algorithmes de machine learning pour le profilage des clients ont été développés. Depuis lors, ces algorithmes ont été mis en œuvre dans plusieurs banques en Suisse et à l'étranger afin de prévenir avec succès la fraude bancaire, de réduire considérablement les faux positifs - jusqu'à 83 % - et d'améliorer la gestion des risques de fraude. 

Un deuxième projet important, d’un montant de 1.2 millions de francs, également financé par Innosuisse de 2019 à 2021, est mené pour repousser les limites de prédiction à l’aide d’outils en apprentissage automatique. Il vise à améliorer et à perfectionner les algorithmes utilisés dans le produit phare de détection des fraudes de NetGuardians dans de nouvelles directions de recherche. Le premier volet qui a été étudié concerne les autoencodeurs qui sont une conception particulière de réseaux de neurones artificiels capables de détecter les anomalies en comparant les données d'entrée et de sortie du réseau. Un mécanisme de compression et de décompression du signal met en évidence les valeurs anormales. La nature non supervisée des autocodeurs les rend particulièrement adaptés à la détection des fraudes dans le contexte bancaire.

Dans le cadre de ce projet, de nouveaux types d’autoencodeurs, dits « centripèdes », ont été inventés. Ils ne reconstruisent plus les jeux de données mais les transforment d’une manière particulière tout en préservant la dimensionnalité. Ces derniers surpassent nettement les autoencodeurs classiques pour la détection de fraudes. De plus, une proposition visant à pallier le manque de données disponibles a été faite en créant des ensembles de données artificiels en utilisant des techniques avancées en mathématiques, comme les copulas ou la théorie des extrêmes, pour simuler de grands ensembles de données comprenant différents types de fraudes bancaires. Le deuxième volet exploré dans ce projet est celui de l’active learning, qui consiste à interroger de manière interactive des transactions bancaires, frauduleuses ou non, pour étiqueter de nouveaux points de données avec les sorties souhaitées et ainsi permettre une amélioration de l’ajustement des algorithmes. Les requêtes sont effectuées auprès d’une base de données dont la nature et la fiabilité varient considérablement d'une application pratique à l'autre. Différents scénarios d’active learning ont été étudiés, tels que les interrogations à haut risque ou ambiguïté maximale, dans différentes configurations. 

Plus d'information :

NetGuardian : https://www.netguardians.ch

https://www.stephan-robert.ch/research/projects/alea/

Contact :

Prof. Stephan Robert-Nicoud
+41 24 557 62 95
stephan.robert@heig-vd.ch  

Tous les événements
Photo banner : A&F architectes (Aouabed&Figuccio)