Qu’est-ce que Gemini Omni Flash ?

Gemini Omni Flash est le premier modèle de la famille Gemini Omni de Google, commençant par la génération vidéo et le montage vidéo conversationnel.

Qu'est-ce qui différencie Gemini Omni du Veo ou d'autres modèles vidéo ?

L'angle principal de la page est un flux de travail multimodal : Gemini Omni peut combiner des images, de l'audio, de la vidéo et du texte en entrée, puis générer et affiner des vidéos via un langage naturel.

Gemini Omni peut-il utiliser l'audio comme entrée ?

L'article de Google montre des exemples utilisant le rythme musical et les références audio, tout en notant que seules les références vocales sont prises en charge pour le démarrage de l'audio et que d'autres types d'entrée audio seront déployés ultérieurement.

Puis-je utiliser les vidéos de présentation en production ?

Ce code HTML fait désormais référence aux liens MP4 distants de Google Cloud Storage utilisés par les exemples d'annonces officielles de Gemini Omni. Conservez l’attribution et vérifiez les droits d’utilisation avant la sortie en production.

Existe-t-il une API Gemini Omni ?

Google indique que les API destinées aux développeurs et aux entreprises clientes arriveront dans les semaines à venir. La copie de production doit donc utiliser une formulation sécurisée jusqu'à ce que l'accès soit confirmé pour votre compte.

Générateur vidéo Gemini Omni AI

Gemini Omni Flash est le nouveau modèle de création multimodal de Google permettant de transformer du texte, des images, des fichiers audio et des vidéos en vidéos IA de haute qualité, puis de les éditer en langage naturel, une instruction à la fois.

Montage vidéo en langage naturel: Modifiez la scène, l'objet, la caméra, le mouvement, le style et les matériaux en décrivant simplement le prochain changement.
Texte, image, audio et vidéo: Combinez plusieurs références en une seule sortie cohérente au lieu de basculer entre des outils d’IA distincts.
Cohérence multi-tours: Chaque modification s'appuie sur la précédente, aidant les personnages, la physique et le contexte visuel à rester cohérents.
Narration fondée sur la connaissance: Créez des explications et des scènes significatives en utilisant la compréhension des Gemini de la science, de la culture et de l’histoire.
Mouvement et matériaux précis: Générez des effets impliquant la gravité, l'énergie cinétique, les ondulations des liquides, le rythme de l'éclairage et les surfaces réfléchissantes.
Avatar + Transparence SynthID: Les vidéos d’avatars personnels et la transparence du contenu généré par l’IA sont prises en charge par la pile d’IA responsable de Google.
Modifier des vidéos via la conversation: Les exemples officiels de Gemini Omni montrent comment une vidéo source peut être transformée grâce à de courtes invites en langage naturel. Les composants vidéo ci-dessous sont des espaces réservés de démonstration jouables ; remplacez les fichiers MP4 locaux par des actifs sous licence officielle lors de la publication.
Interprétation rapide avancée: Les exemples de Gemini Omni combinent la transformation d'objets, la logique de scène récursive et l'action synchronisée en une seule invite.
Génération de scènes audio natives: Gemini Omni peut utiliser des signaux audio dans le cadre des instructions de génération, créant ainsi des événements visuels synchronisés avec la musique ou l'interaction.
Connaissance du monde et physique: Gemini Omni se positionne comme une génération vidéo fondée sur les connaissances du monde réel de Gemini, y compris l'intuition physique et les concepts explicables.

Sélectionnez le modèle: Choisissez la génération vidéo multimodale de style Gemini Omni dans la zone du modèle vidéo AI.
Détails d'entrée: Ajoutez une invite et des références facultatives telles qu'une image, une vidéo ou un audio pour guider le clip final.
Générez votre vidéo: Prévisualisez le résultat, modifiez-le en langage naturel et exportez-le pour les plateformes sociales.

Google I/O 2026 · Vidéo sur l'IA multimodale

Générateur vidéo Gemini Omni AI

Explorer les cas d'utilisation

Ce qui rend Gemini Omni différent

01 / Création conversationnelle

Montage vidéo en langage naturel

Modifiez la scène, l'objet, la caméra, le mouvement, le style et les matériaux en décrivant simplement le prochain changement.

02 / Toute entrée

Texte, image, audio et vidéo

Combinez plusieurs références en une seule sortie cohérente au lieu de basculer entre des outils d’IA distincts.

03 / Mémoire de scène

Cohérence multi-tours

Chaque modification s'appuie sur la précédente, aidant les personnages, la physique et le contexte visuel à rester cohérents.

04 / Connaissance du monde

Narration fondée sur la connaissance

Créez des explications et des scènes significatives en utilisant la compréhension des Gemini de la science, de la culture et de l’histoire.

05 / Physique

Mouvement et matériaux précis

Générez des effets impliquant la gravité, l'énergie cinétique, les ondulations des liquides, le rythme de l'éclairage et les surfaces réfléchissantes.

06 / IA responsable

Avatar + Transparence SynthID

Les vidéos d’avatars personnels et la transparence du contenu généré par l’IA sont prises en charge par la pile d’IA responsable de Google.

Modifier des vidéos via la conversation

Les exemples officiels de Gemini Omni montrent comment une vidéo source peut être transformée grâce à de courtes invites en langage naturel. Les composants vidéo ci-dessous sont des espaces réservés de démonstration jouables ; remplacez les fichiers MP4 locaux par des actifs sous licence officielle lors de la publication.

Prompt

Réalisez la sculpture avec des bulles.

Sortie vidéo

Prompt

Lorsque la personne touche le miroir, le miroir ondule magnifiquement comme un liquide, et le bras de la personne se transforme en matériau miroir réfléchissant.

Sortie vidéo

Interprétation rapide avancée

Les exemples de Gemini Omni combinent la transformation d'objets, la logique de scène récursive et l'action synchronisée en une seule invite.

Prompt

Baissez les lumières de la pièce. Placez une pièce en damier noir et blanc à l'intérieur d'une sphère de verre qui flotte au-dessus de la main, à l'intérieur elle contient une représentation récursive de la même main tenant la sphère, créant une infinité de pièces récursives. La caméra se rapproche lentement de la sphère, créant une boucle vidéo.

Sortie vidéo

Génération de scènes audio natives

Gemini Omni peut utiliser des signaux audio dans le cadre des instructions de génération, créant ainsi des événements visuels synchronisés avec la musique ou l'interaction.

Prompt

Les lumières des appartements commencent à s’allumer au rythme de la musique.

Sortie vidéo

Prompt

Ajoutez des sons de harpe synchronisés lorsque je touche chaque feuille de fougère. Changez la structure des feuilles pour qu'elles ressemblent toutes à une vie végétale bioluminescente 3D semi-translucide, avec des lucioles bioluminescentes volant autour d'elles qui réagissent pendant que je joue.

Sortie vidéo

Connaissance du monde et physique

Gemini Omni se positionne comme une génération vidéo fondée sur les connaissances du monde réel de Gemini, y compris l'intuition physique et les concepts explicables.

Prompt

Une bille qui roule rapidement sur une piste de style réaction en chaîne, avec un tir continu et fluide.

Sortie vidéo

Prompt

Claymation explicatif du repliement des protéines, tout est fait d'argile, pas de mains, stop motion, précis.

Sortie vidéo

Contenu cinématographique prêt pour les réseaux sociaux

Utilisez les invites de style Gemini Omni pour les clips sociaux verticaux, les avatars de créateurs, les explicatifs, les vidéos de remix et les courts éléments promotionnels.

Prompt

Créez des vidéos avec votre propre avatar numérique pour que le clip généré vous ressemble. Utilisez-le pour des annonces personnalisées, une narration sociale et du contenu court.

Sortie vidéo

Gemini Omni vs flux de travail vidéo IA traditionnel

Le récit de la page de destination de Gemini Omni devrait mettre en évidence la compression du flux de travail : moins d'outils séparés, plus de références multimodales et une itération en langage naturel plus facile.

Dimensions

Flux de travail traditionnel

Direction Gemini Omni

Matrice 1

Outils séparés de texte à image, d'image à vidéo, de synchronisation labiale et d'édition vidéo

Une famille de modèles de création multimodale

Matrice 2

Transfert manuel de référence entre outils

Références texte, image, vidéo et audio dans un flux cohérent

Matrice 3

Plus de perte de cohérence à chaque étape de génération

Montage conversationnel avec mémoire de scène

Matrice 3

Itération d'invite plus difficile pour les modifications au niveau de la scène

Convient à la génération de vidéos, aux remix, aux explications et au contenu d'avatar

Comment utiliser Gemini Omni sur Collart

Step 1

Sélectionnez le modèle

Choisissez la génération vidéo multimodale de style Gemini Omni dans la zone du modèle vidéo AI.

Step 2

Détails d'entrée

Ajoutez une invite et des références facultatives telles qu'une image, une vidéo ou un audio pour guider le clip final.

Step 3

Générez votre vidéo

Prévisualisez le résultat, modifiez-le en langage naturel et exportez-le pour les plateformes sociales.

Générer maintenant

Foire aux questions

Transformez vos idées en visuels époustouflants

Générer maintenant