01 / Creación conversacional
Edición de vídeo en lenguaje natural
Edite escenas, objetos, cámaras, movimientos, estilos y materiales simplemente describiendo el próximo cambio.
Gemini Omni Flash es el nuevo modelo de creación multimodal de Google para convertir texto, imágenes, audio y videos en videos de IA de alta calidad y luego editarlos mediante lenguaje natural, una instrucción a la vez.
Gemini Omni Flash es el nuevo modelo de creación multimodal de Google para convertir texto, imágenes, audio y videos en videos de IA de alta calidad y luego editarlos mediante lenguaje natural, una instrucción a la vez.
01 / Creación conversacional
Edite escenas, objetos, cámaras, movimientos, estilos y materiales simplemente describiendo el próximo cambio.
02 / Cualquier entrada
Combine múltiples referencias en una salida coherente en lugar de cambiar entre herramientas de IA separadas.
03 / Memoria de escena
Cada edición se basa en la anterior, lo que ayuda a que los personajes, la física y el contexto visual se mantengan coherentes.
04 / Conocimiento mundial
Cree explicaciones y escenas significativas utilizando la comprensión de Gemini sobre la ciencia, la cultura y la historia.
05 / Física
Genera efectos que involucran gravedad, energía cinética, ondas de líquido, ritmo de iluminación y superficies reflectantes.
06 / IA responsable
Los vídeos de avatares personales y la transparencia del contenido generado por IA son compatibles con la pila de IA responsable de Google.
Los ejemplos oficiales de Gemini Omni muestran cómo se puede transformar un vídeo fuente mediante breves indicaciones en lenguaje natural. Los componentes de vídeo siguientes son marcadores de posición de demostración reproducibles; reemplace los archivos MP4 locales con activos con licencia oficial al publicar.
Haz la escultura con burbujas.
Cuando la persona toca el espejo, haz que el espejo se ondula maravillosamente como un líquido y el brazo de la persona se convierte en un material de espejo reflectante.
Los ejemplos de Gemini Omni combinan transformación de objetos, lógica de escena recursiva y acción sincronizada en un solo mensaje.
Atenúa las luces de la habitación. Coloque una habitación de tablero de ajedrez en blanco y negro dentro de una esfera de vidrio que flota siguiendo sobre la mano, en su interior contiene una representación recursiva de la misma mano sosteniendo la esfera, creando una infinita recursividad de habitaciones. La cámara se acerca lentamente a la esfera, creando un bucle de vídeo.
Gemini Omni puede utilizar señales de audio como parte de la instrucción de generación, creando eventos visuales sincronizados con la música o la interacción.
Las luces de los apartamentos empiezan a encenderse al ritmo de la música.
Agregue sonidos de arpa sincronizados cuando toco cada hoja de helecho. Cambia la estructura de la hoja para que se parezca a una planta bioluminiscente en 3D semitranslúcida, con luciérnagas bioluminiscentes volando a su alrededor que reaccionan mientras juego.
Gemini Omni se posiciona como generación de video basada en el conocimiento del mundo real de Gemini, incluida la intuición física y conceptos explicables.
Una canica rodando rápidamente en una pista estilo reacción en cadena, disparo continuo y suave.
Explicación con plastilina del plegamiento de proteínas, todo está hecho de arcilla, sin manos, stop motion, preciso.
Utilice indicaciones estilo Gemini Omni para clips sociales verticales, avatares de creadores, explicaciones, videos remezclados y activos promocionales cortos.
Crea vídeos con tu propio avatar digital para que el clip generado se vea y suene como tú. Úselo para anuncios personalizados, narraciones sociales y contenido breve.
La narrativa de la página de destino de Gemini Omni debería resaltar la compresión del flujo de trabajo: menos herramientas separadas, más referencias multimodales y una iteración del lenguaje natural más sencilla.
Step 1
Elija la generación de video multimodal estilo Gemini Omni en el área del modelo de video AI.
Step 2
Agregue un mensaje y referencias opcionales, como imágenes, videos o audio, para guiar el clip final.
Step 3
Obtenga una vista previa del resultado, edítelo con lenguaje natural y exporte para plataformas sociales.