Big Data : une start-up analyse la fraude avec les technos de Facebook et la NSA

Le système d’analyse et de détection des fraudes en temps réel ArgyleDB s’appuie sur Accumulo, base de données créée par la NSA, et Presto, moteur de requêtes SQL développé par Facebook.

Une start-up américaine du Big Data, Argyle Data, vient de lancer son système d’analyse et de détection de la fraude en temps réel. L’offre, ArgyleDB, est basée sur Presto, le moteur de requêtes SQL distribué sous licence Open Source et développé par Facebook, et sur Accumulo, un système de gestion de base de données conçu par la NSA (National Security Agency).

Détecter la fraude à l’échelle du pétaoctet

Les développements de la base Accumulo sont pilotés par la fondation Apache depuis 2011. Mais la solution a été créée en 2008 par l’Agence nationale de sécurité américaine pour analyser le contenu de paquets réseau IP (Deep Packet Inspection – DPI) et stocker des données massives. En plus d’utiliser la base « Made in NSA », le système ArgyleDB s’appuie sur Presto. Et ce pour analyser les données en utilisant des requêtes SQL et automatiser le processus. Ces deux technologies Open Source sont conçues pour engranger et filtrer les données déjà stockées dans le framework Hadoop.

En complément, Argyle Data utilise des algorithmes d’apprentissage automatique (« Machine Learning ») pour construire des modèles prédictifs à partir de jeux de données trop étendus et complexes pour être analysés par l’esprit humain. La promesse : détecter une activité frauduleuse, à l’échelle du pétaoctet, dans les minutes plutôt que dans les 24 heures.

Digérer les appels téléphoniques de tout un pays

Les services financiers, les fournisseurs de communications mobiles et les poids lourds du commerce en ligne sont ciblés. Pour les convaincre, Argyle Data dispose du soutien de solides investisseurs. Outre Intel, Qualcomm et Vodafone, les fonds d’investissement Acero Capital, ATA Ventures et SK Telecom Ventures financent Argyle Data. La jeune pousse installée à San Mateo, Californie, a récemment levé 4,5 millions de dollars supplémentaires.

Lire aussi
– Les start-ups Hadoop engrangent les millions… pas les prestataires
– La NSA bascule sa base de données NoSQL Accumulo en open source