01 / Création conversationnelle
Montage vidéo en langage naturel
Modifiez la scène, l'objet, la caméra, le mouvement, le style et les matériaux en décrivant simplement le prochain changement.
Gemini Omni Flash est le nouveau modèle de création multimodal de Google permettant de transformer du texte, des images, des fichiers audio et des vidéos en vidéos IA de haute qualité, puis de les éditer en langage naturel, une instruction à la fois.
Gemini Omni Flash est le nouveau modèle de création multimodal de Google permettant de transformer du texte, des images, des fichiers audio et des vidéos en vidéos IA de haute qualité, puis de les éditer en langage naturel, une instruction à la fois.
01 / Création conversationnelle
Modifiez la scène, l'objet, la caméra, le mouvement, le style et les matériaux en décrivant simplement le prochain changement.
02 / Toute entrée
Combinez plusieurs références en une seule sortie cohérente au lieu de basculer entre des outils d’IA distincts.
03 / Mémoire de scène
Chaque modification s'appuie sur la précédente, aidant les personnages, la physique et le contexte visuel à rester cohérents.
04 / Connaissance du monde
Créez des explications et des scènes significatives en utilisant la compréhension des Gemini de la science, de la culture et de l’histoire.
05 / Physique
Générez des effets impliquant la gravité, l'énergie cinétique, les ondulations des liquides, le rythme de l'éclairage et les surfaces réfléchissantes.
06 / IA responsable
Les vidéos d’avatars personnels et la transparence du contenu généré par l’IA sont prises en charge par la pile d’IA responsable de Google.
Les exemples officiels de Gemini Omni montrent comment une vidéo source peut être transformée grâce à de courtes invites en langage naturel. Les composants vidéo ci-dessous sont des espaces réservés de démonstration jouables ; remplacez les fichiers MP4 locaux par des actifs sous licence officielle lors de la publication.
Réalisez la sculpture avec des bulles.
Lorsque la personne touche le miroir, le miroir ondule magnifiquement comme un liquide, et le bras de la personne se transforme en matériau miroir réfléchissant.
Les exemples de Gemini Omni combinent la transformation d'objets, la logique de scène récursive et l'action synchronisée en une seule invite.
Baissez les lumières de la pièce. Placez une pièce en damier noir et blanc à l'intérieur d'une sphère de verre qui flotte au-dessus de la main, à l'intérieur elle contient une représentation récursive de la même main tenant la sphère, créant une infinité de pièces récursives. La caméra se rapproche lentement de la sphère, créant une boucle vidéo.
Gemini Omni peut utiliser des signaux audio dans le cadre des instructions de génération, créant ainsi des événements visuels synchronisés avec la musique ou l'interaction.
Les lumières des appartements commencent à s’allumer au rythme de la musique.
Ajoutez des sons de harpe synchronisés lorsque je touche chaque feuille de fougère. Changez la structure des feuilles pour qu'elles ressemblent toutes à une vie végétale bioluminescente 3D semi-translucide, avec des lucioles bioluminescentes volant autour d'elles qui réagissent pendant que je joue.
Gemini Omni se positionne comme une génération vidéo fondée sur les connaissances du monde réel de Gemini, y compris l'intuition physique et les concepts explicables.
Une bille qui roule rapidement sur une piste de style réaction en chaîne, avec un tir continu et fluide.
Claymation explicatif du repliement des protéines, tout est fait d'argile, pas de mains, stop motion, précis.
Utilisez les invites de style Gemini Omni pour les clips sociaux verticaux, les avatars de créateurs, les explicatifs, les vidéos de remix et les courts éléments promotionnels.
Créez des vidéos avec votre propre avatar numérique pour que le clip généré vous ressemble. Utilisez-le pour des annonces personnalisées, une narration sociale et du contenu court.
Le récit de la page de destination de Gemini Omni devrait mettre en évidence la compression du flux de travail : moins d'outils séparés, plus de références multimodales et une itération en langage naturel plus facile.
Step 1
Choisissez la génération vidéo multimodale de style Gemini Omni dans la zone du modèle vidéo AI.
Step 2
Ajoutez une invite et des références facultatives telles qu'une image, une vidéo ou un audio pour guider le clip final.
Step 3
Prévisualisez le résultat, modifiez-le en langage naturel et exportez-le pour les plateformes sociales.