Google a officiellement présenté aujourd’hui Gemini Omni, une nouvelle famille de modèles d’intelligence artificielle dédiée à la création vidéo. Annoncé lors de l’événement Google I/O 2026, Gemini Omni Flash permet de créer et d’éditer des vidéos en se basant sur du texte, des images, des sons et même d’autres vidéos.
Ce nouvel outil combine des fonctionnalités déjà vues dans Veo et Nano Banana en un seul modèle. Google promet que Gemini Omni peut maintenir la cohérence entre les scènes tout en interprétant de manière holistique le mouvement et la dynamique des objets.
Interaction avancée et filigrane numérique
Selon l’annonce officielle de Google, ce modèle a été développé pour permettre aux utilisateurs d’interagir avec l’intelligence artificielle lors de l’édition. Cela signifie qu’il est possible de modifier les personnages, les arrière-plans, les styles visuels ou les actions au sein d’une scène en utilisant des commandes en langage naturel.
Le principal concurrent direct de Gemini Omni, Sora, a été fermé par OpenAI en mars dernier. Google tire parti de cette opportunité en étendant le concept d’édition basée sur la conversation aux vidéos multimodales.
Les vidéos créées par Gemini Omni intégreront un filigrane numérique SynthID pour identifier le contenu généré par l’IA.
Disponibilité sur plusieurs plateformes
Dès aujourd’hui, le modèle Gemini Omni Flash est disponible pour les abonnés des plans Google AI Plus, Pro et Ultra via l’application Gemini et la plateforme Google Flow. De plus, ce nouveau modèle d’intelligence artificielle sera intégré aux applications YouTube Shorts et YouTube Create.
