Pour gérer vos consentements :

Qui est MosaicML, que Databricks acquiert pour plus d’un milliard de dollars ?

Pour MosaicML, la suite de l’histoire s’écrira chez Databricks. Ce dernier va débourser environ 1,3 Md$, primes de rétention comprises, pour s’emparer de la start-up américaine.

L’annonce de ce rapprochement se fait sous la bannière de l’IA générative. Databricks entend, en particulier, faire de sa plate-forme Lakehouse « le meilleur endroit pour construire […] des grands modèles de langage ».

À l’origine, on ne parlait pas d’IA générative chez MosaicML. Fondée en 2020, la société avait réellement pris son envol à l’automne 2021, ayant levé une trentaine de millions de dollars. Sa boîte à outils comportait alors deux briques. D’une part, une bibliothèque ouverte de méthodes d’entraînement et de techniques pour les assembler sous forme de « recettes ». De l’autre, un outil pour visualiser l’effet de ces assemblages sur le rapport coût/performances.

MosaicML résumait alors l’enjeu en deux questions :
« Quelle est la manière la plus rapide ou la plus économique d’entraîner un modèle donné en maintenant la même qualité qu’à l’origine ? »
« Quel est le plus haut niveau de qualité atteignable à budget constant ? »

Ces éléments allaient constituer le socle d’une plate-forme, ouverte un an plus tard. MosaicML y a depuis lors greffé, entre autres, sa propre bibliothèque de streaming de données. Ou encore son propre planificateur pour Kubernetes.

L’orchestrateur de conteneurs est une pièce fondamentale dans l’architecture de la plate-forme, en tant que support de déploiement multicloud. La bibliothèque de streaming permet quant à elle de travailler en stateless (elle complète le chargement dynamique du code et des images Docker).

La plate-forme optimise des éléments tels que le parallélisme, les interconnexions réseau et les frameworks logiciels utilisés.

MosaicML a aussi une plate-forme d’inférence

Depuis le lancement du produit, MosaicML a multiplié les démonstrations chiffrées, de l’entraînement de BERT « à partir de zéro pour 20 $ » ou de Stable Diffusion « pour moins de 50 k$ ». Début mai, il a ajouté à son catalogue une plate-forme d’inférence. Elle se compose de deux niveaux d’offre :

Édition Starter
Accès, par API publique, à divers modèles open source hébergés par MosaicML. Ils sont pour le moment au nombre de quatre. Deux pour générer du texte (modèles maison MPT), deux pour en vectoriser (modèles Instructor).

Édition Enterprise
Déploiement et exécution de tout modèle chez tout CSP. La promesse : « En un clic, transformez un checkpoint en une API hébergée dans votre VPC ». La facturation se fait à la minute-GPU. Une intégration avec le hub Hugging Face est disponible.

MosaicML propose une option de déploiement sur site.

Illustration principale © Yan – Adobe Stock

Recent Posts

Cybersécurité : Darktrace dans l’escarcelle de Thoma Bravo

La société britannique de cybersécurité Darktrace a accepté une offre de rachat de 5,32 milliards…

11 heures ago

Étude Trends of IT 2024 : comment les managers IT développent leurs projets

Silicon et KPMG lancent la deuxième édition de l'étude Trends of IT. Cette édition 2024…

13 heures ago

Atos : l’Etat veut acquérir les activités souveraines

Le ministère de l'économie a adressé une lettre d'intention à la direction d'Atos pour racheter…

15 heures ago

Arnaud Monier – SNCF Connect & Tech : « Notre moteur, c’est l’innovation et nous procédons par incrémentation »

Directeur Technologie de SNCF Connect & Tech, Arnaud Monier lance une campagne de recrutement pour…

17 heures ago

Etats-Unis : les grands de l’IT licencient au nom de l’IA

Les grands de l'IT suppriment des milliers de jobs au nom du déploiement de. Une…

17 heures ago

Appel de Rome : Cisco rejoint Microsoft et IBM pour une IA éthique

Quatre ans après l’appel de Rome - un pacte présenté en 2020 par le Vatican…

18 heures ago