Pour gérer vos consentements :

Machine Learning : qui fait quoi sur GitHub

Quel est l’état du Machine Learning et la Data Science sur GitHub ? La plateforme, propriété de Microsoft depuis  juin dernier,  a fait un relevé des contributions sur l’ensemble de l’année 2018 en comptabilisant le code partagé, les commentaires et les Pull Request

Quel langage pour le Machine Learning ?

Python est en tête des référentiels liés au Machine Learning.  A noter que les langages Julia et R  sont couramment utilisés par les scientifiques des données (data scientists), et Scala est de plus en plus apprécié pour interagir avec des systèmes de Big Data comme Apache Spark.

Principales librairies



GitHub a calculé le pourcentage de projets ayant importé des librairies Python populaires.

– Numpy prend en charge des opérations mathématiques sur des données multidimensionnelles, est la plus importée ; elle est utilisée dans près des trois quarts des projets de Machine Learning et de Data Science.
Scipy, une librairie de calcul scientifique, pandas, une librairie de gestion de jeux de données, et matplotlib, une bibliothèque de visualisations, sont utilisées dans plus de 40 % des projets Machine Learning et de Data Science.
Scikit-learn contient des implémentations d’un grand nombre d’algorithmes de Machine Learning ; elle est utilisée dans près de 40 % des projets.
tensorflow est un outil conçu pour travailler avec des réseaux neuronaux, est employé dans près d’un quart des librairies.

Projets Machine Learning


Tensorflow est de loin le projet le plus populaire, avec plus de cinq fois plus de contributeurs que le deuxième du classement, scikit-learn.

Deux projets, explosion/spaCy et RasaHQ/rasa_nlu, sont consacrés aux problématiques de traitement en langage naturel (NLP), et quatre sont dédiés au traitement d’images : CMU-Perceptual-Computing-Lab/openpose, thtrieu/darkflow, ageitgey/face_recognition et tesseract-ocr/tesseract.

Le code source du langage Julia a également enregistré l’un des plus grands nombres de contributions en 2018.

Source : Rapport Octoverse 2018 de GitHub

Recent Posts

Cybersécurité : Darktrace dans l’escarcelle de Thoma Bravo

La société britannique de cybersécurité Darktrace a accepté une offre de rachat de 5,32 milliards…

9 heures ago

Étude Trends of IT 2024 : comment les managers IT développent leurs projets

Silicon et KPMG lancent la deuxième édition de l'étude Trends of IT. Cette édition 2024…

11 heures ago

Atos : l’Etat veut acquérir les activités souveraines

Le ministère de l'économie a adressé une lettre d'intention à la direction d'Atos pour racheter…

13 heures ago

Arnaud Monier – SNCF Connect & Tech : « Notre moteur, c’est l’innovation et nous procédons par incrémentation »

Directeur Technologie de SNCF Connect & Tech, Arnaud Monier lance une campagne de recrutement pour…

15 heures ago

Etats-Unis : les grands de l’IT licencient au nom de l’IA

Les grands de l'IT suppriment des milliers de jobs au nom du déploiement de. Une…

15 heures ago

Appel de Rome : Cisco rejoint Microsoft et IBM pour une IA éthique

Quatre ans après l’appel de Rome - un pacte présenté en 2020 par le Vatican…

15 heures ago