On pensait son lancement reporté à 2024. Gemini vient finalement de faire son entrée.

Il est le nouveau modèle de fondation référent de Google… qui en vante, notamment les capacités multimodales « natives » – au sens où elles ne résultent pas de la combinaison de briques formées séparément.

Une version Nano pour exécution locale

Gemini est disponible en trois familles : Ultra, Pro et Nano. Cette dernière se compose de deux versions (1,8B et 3,25B). Obtenues par distillation à partir des modèles plus grands et quantisée au format 4 bits, elles ciblent les terminaux mobiles. Google en donne un premier aperçu sur les Pixel 8 Pro, à deux niveaux. D’un côté, pour faire des résumés dans l’application Enregistreur. De l’autre, pour la saisie avec Gboard, initialement au sein de WhatsApp.

Gemini dans Bard : l’Europe attendra

Autre surface sur laquelle Gemini est disponible : Bard. Le chatbot exploite plus précisément la version Pro. Uniquement en anglais, néanmoins. Et on ne peut pas y accéder en Europe pour le moment.

À partir du 13 décembre, l’API Gemini Pro sera accessible dans l’AI Studio de Google et sur Vertex AI. En parallèle, on pourra commencer à exploiter Gemini avec AIcore. Ce service système arrivé avec Android 14 assure la gestion des modèles, leur exécution ainsi que leur affinage « à la volée » par la méthode LoRA.

Google promet une intégration « dans les prochains mois » au sein de son moteur de recherche. Ainsi que dans Chrome, Duet AI et Google Ads. En attendant, on peut l’expérimenter sur la SGE (Search Generative Experience)… si on se trouve aux États-Unis.

Pas de Gemini Ultra avant 2024 (une version « Advanced » de Bard y donnera notamment accès). Motif : il faut encore en améliorer la sûreté (audits tiers, RLHF…).

Pas de date de sortie annoncée pour AlphaCode 2. Basé sur une version spécialisée de Gemini, il est censé traiter des problèmes allant au-delà du codage, pour toucher aux mathématiques et à l’informatique théorique. Google a plus précisément pris Gemini Pro comme point de départ. Il l’a d’abord affiné avec la méthode GOLD (generation by off-policy learning from demonstrations). Puis il l’a formé sur une version actualisée du dataset CodeContests… avant un dernier finetuning sur « un jeu de données plus qualitatif ».

Récapitulatif des disponibilités :

– À présent, sur Pixel 8 Pro, Gemini Nano dans les applications Enregistreur et WhatsApp

– Également à présent, Gemini Pro dans Bard… mais pas encore en Europe

– Idem pour Gemini Pro dans la Search Generative Experience… uniquement aux USA

– Le 13 décembre, API Gemini Pro dans l’AI Studio et Vertex AI

– « Dans les prochains mois » au sein de Google Search, Ads, Chrome et Duet AI

– En 2024, Gemini Ultra dans Bard Advanced

– Disponibilité à préciser pour AlphaCode 2 (la version originale n’est pas non plus ouverte au public)

