Pour gérer vos consentements :

Google finance une intelligence artificielle pour le Big Data

Les inquiétudes du physicien Stephen Hawking sur le potentiel de l’Intelligence Artificielle – il y voit une menace pour l’Humanité – ne ralentissent pas Google. Le géant californien finance un projet baptisé Automatic Statistician qui vise à développer une forme d’intelligence artificielle pour la data science, soit l’analyse des Big Data. En résumé, le projet, qui en est encore à ses stades de recherche préliminaire au sein de l’université de Cambridge, vise à automatiser les tâches essentielles du statisticien : le choix du modèle statistique le plus pertinent pour un jeu de données, ainsi que celui des variables permettant de dégager une analyse de la masse d’information.

Dans un billet de blog annonçant le financement de Google, Kevin Murphy, scientifique travaillant pour la première régie publicitaire online, explique les freins que cette approche vise à lever : « Le premier problème est que les méthodes actuelles de Machine Learning requièrent toujours une expertise humaine considérable dans la conception des fonctions et modèles. Le second problème est que le résultat des méthodes actuelles, bien qu’exact, est souvent difficile à comprendre, donc à croire. » L’objectif du projet Automatic Statistician est précisément de s’attaquer à ces deux difficultés « en utilisant des stratégies de sélection de modèles Bayésiens pour choisir les bons modèles et fonctions et interpréter le résultat de façon compréhensible, dans des rapports générés automatiquement mais lisibles par un être humain ».

Une première version pour tester

Le site du projet offre quelques exemples de ces statistiques robotisées. Mais sur des jeux de données relativement simples, des séries temporelles comme l’évolution du nombre de passagers aériens ou celle des rayonnements du soleil. Kevin Murphy explique que cette approche est en passe d’être généralisée « pour trouver des modèles dans d’autres types de données, comme des problèmes de régression multidimensionnelle ou des bases de données relationnelles ». Une version simplifiée du système est disponible depuis août dernier, signale Google. Elle permet d’importer un set de données et de recevoir une analyse produite automatiquement quelques minutes plus tard. Une version plus riche de ce service est attendue début 2015.

Comme le signalent nos confrères de GigaOm, Google n’est pas la seule société à s’essayer à ce type d’approches visant à dépasser le manque de compétences en statistiques sur le marché. Une start-up, Skytree, a bâti un outil similaire (Adviser), aujourd’hui abandonné. Et d’autres jeunes pousses s’intéressent également à des fonctionnalités similaires.

A lire aussi :
Le Machine Learning vient au secours du Big Data
Recruter un data scientist ? Bienvenue au Far-West

Crédit photo : agsandrew / Shutterstock

Recent Posts

IA générative : les lignes directrices de l’ANSSI

Formats de paramètres, méthodes d'apprentissage, mutualisation GPU... Voici quelques-unes des recommandations de l'ANSSI sur l'IA…

14 heures ago

De la marque blanche à l’« exemption souveraine », Broadcom fait des concessions aux fournisseurs cloud

À la grogne des partenaires VMware, Broadcom répond par diverses concessions.

17 heures ago

iPadOS finalement soumis au DMA

iPadOS a une position suffisamment influente pour être soumis au DMA, estime la Commission européenne.

19 heures ago

ChatGPT : le Financial Times signe avec OpenAI

FT Group, éditeur du Financal Times, a signé un accord avec OpenAI afin d'utiliser ses…

3 jours ago

Les hyperscalers renforcent leurs recherches et datacenters pour l’IA

Au premier trimestre, Microsoft, Meta/Facebook et Alphabet/Google ont déjà investi plus de 32 milliards $…

3 jours ago

Cybersécurité : Darktrace dans l’escarcelle de Thoma Bravo

La société britannique de cybersécurité Darktrace a accepté une offre de rachat de 5,32 milliards…

4 jours ago