Gemma 4 : l’IA de Google peut tourner hors ligne, même sur un smartphone

Par Romain Delcourt

avril 3, 2026

4 min de lecture

Google ouvre davantage son IA avec Gemma 4, une nouvelle famille de modèles capables de fonctionner localement, y compris sans connexion à Internet. L’annonce compte surtout pour les développeurs, mais pas seulement : certaines versions sont assez légères pour viser les smartphones et d’autres appareils en périphérie. Avec ce lancement, Google reprend une partie des avancées de ses grands modèles maison pour les rendre plus accessibles.

Google décline Gemma 4 en quatre modèles pour viser du mobile au poste de travail

Gemma 4 arrive en quatre variantes, avec des tailles différentes selon la puissance visée. Les modèles les plus légers, de 2 et 4 milliards de paramètres, sont conçus pour les appareils à ressources limitées, notamment les smartphones.

À l’autre bout de la gamme, Google propose une version en mélange d’experts de 26 milliards de paramètres et un modèle dense de 31 milliards pour des machines plus musclées. En clair, plus le nombre de paramètres grimpe, plus le modèle peut gagner en qualité, au prix d’exigences matérielles plus élevées.

Google affirme que Gemma 4 dépasse des modèles bien plus gros

Le groupe met en avant un point très précis : Gemma 4 offrirait un niveau d’intelligence exceptionnel par paramètre. Pour appuyer cette promesse, Google cite les performances observées dans le classement textuel Arena AI.

Les versions 31 milliards et 26 milliards y auraient décroché la troisième et la sixième place. D’après Google, elles ont même dépassé des modèles jusqu’à 20 fois plus volumineux, un argument taillé pour séduire ceux qui cherchent un bon compromis entre performances et coût matériel.

Les fonctions multimodales élargissent l’usage bien au-delà du texte

Toutes les versions de Gemma 4 peuvent traiter des images et de la vidéo. Cela ouvre la porte à des usages concrets comme l’OCR, autrement dit la reconnaissance de texte à partir d’un document ou d’une image.

Les deux plus petites versions vont plus loin encore avec la prise en charge de l’audio et de la reconnaissance vocale. Google précise aussi que Gemma 4 peut générer du code hors ligne, un point loin d’être anodin pour les développeurs qui veulent travailler localement, sans dépendre d’un accès Internet.

Autre détail qui change l’échelle du projet : les modèles ont été entraînés sur plus de 140 langues.

La licence Apache 2.0 change nettement la donne pour les développeurs

C’est l’un des virages les plus importants de cette annonce. Gemma 4 passe sous licence Apache 2.0, alors que les précédentes versions reposaient sur une licence Gemma propriétaire.

Ce choix offre beaucoup plus de liberté pour modifier, adapter et intégrer les modèles à des besoins spécifiques. Google insiste sur la souplesse apportée par cette licence ouverte, qui facilite aussi bien les déploiements locaux que les usages dans le cloud.

Google mise sur le contrôle total des données et de l’infrastructure

Avec cette ouverture, Google met en avant une promesse très claire : davantage de flexibilité et de souveraineté numérique. Les utilisateurs peuvent garder la main sur leurs données, leur infrastructure et sur les modèles eux-mêmes.

Pour les entreprises comme pour les développeurs indépendants, cela signifie la possibilité de déployer des solutions sans dépendre totalement d’un service distant, avec moins de contraintes sur l’hébergement et l’exploitation.

Les poids de Gemma 4 sont déjà disponibles sur plusieurs plateformes

Google ne se contente pas d’annoncer Gemma 4 : les modèles peuvent déjà être récupérés sur Hugging Face, Kaggle et Ollama. Ce lancement immédiat renforce l’intérêt de cette nouvelle gamme, qui cherche autant à convaincre par ses performances que par sa facilité d’accès.