O que é Gemini Omni Flash?

Gemini Omni Flash é o primeiro modelo da família Gemini Omni do Google, começando com geração de vídeo e edição de vídeo conversacional.

O que torna o Gemini Omni diferente do Veo ou de outros modelos de vídeo?

O ângulo da página principal é o fluxo de trabalho multimodal: Gemini Omni pode combinar imagens, áudio, vídeo e texto como entrada e, em seguida, gerar e refinar vídeos por meio de linguagem natural.

O Gemini Omni pode usar áudio como entrada?

O artigo do Google mostra exemplos de uso de ritmo musical e referências de áudio, ao mesmo tempo em que observa que apenas referências de voz são suportadas para o início do áudio e mais tipos de entrada de áudio serão lançados posteriormente.

Posso usar os vídeos de demonstração na produção?

Este HTML agora faz referência a links MP4 remotos do Google Cloud Storage usados pelos exemplos oficiais de anúncios do Gemini Omni. Mantenha a atribuição e verifique os direitos de uso antes do lançamento da produção.

Existe uma API Gemini Omni?

O Google afirma que APIs para desenvolvedores e clientes corporativos chegarão nas próximas semanas, portanto, a cópia de produção deve usar palavras com disponibilidade segura até que o acesso para sua conta seja confirmado.

Gerador de vídeo Gemini Omni AI

Google I/O 2026 · Vídeo de IA multimodal

Gerador de vídeo Gemini Omni AI

Gemini Omni Flash é o novo modelo de criação multimodal do Google para transformar texto, imagens, áudio e vídeos em vídeos de IA de alta qualidade – e depois editá-los por meio de linguagem natural, uma instrução por vez.

Explore casos de uso

O que torna o Gemini Omni diferente

01 / Criação conversacional

Edição de vídeo em linguagem natural

Edite cena, objeto, câmera, movimento, estilo e materiais simplesmente descrevendo a próxima alteração.

02 / Qualquer entrada

Texto, imagem, áudio e vídeo

Combine várias referências em uma saída coesa em vez de alternar entre ferramentas de IA separadas.

03 / Memória de cena

Consistência multivoltas

Cada edição se baseia na anterior, ajudando os personagens, a física e o contexto visual a permanecerem coerentes.

04 / Conhecimento mundial

Contação de histórias baseada no conhecimento

Crie explicadores e cenas significativas usando a compreensão de ciência, cultura e história de Gemini.

05 / Física

Movimento e materiais precisos

Gere efeitos envolvendo gravidade, energia cinética, ondulações líquidas, ritmo de iluminação e superfícies reflexivas.

06 / IA responsável

Transparência Avatar + SynthID

Vídeos de avatares pessoais e transparência de conteúdo gerado por IA são suportados pela pilha de IA responsável do Google.

Edite vídeos por meio de conversas

Os exemplos oficiais do Gemini Omni mostram como um vídeo de origem pode ser transformado por meio de instruções curtas em linguagem natural. Os componentes de vídeo abaixo são marcadores de demonstração jogáveis; substitua os arquivos MP4 locais por ativos licenciados oficiais ao publicar.

Prompt

Faça a escultura com bolhas.

Vídeo de saída

Prompt

Quando a pessoa toca o espelho, faça o espelho ondular lindamente como um líquido, e o braço da pessoa se transformará em um material espelhado reflexivo.

Vídeo de saída

Interpretação de Prompt Avançada

Os exemplos do Gemini Omni combinam transformação de objetos, lógica de cena recursiva e ação sincronizada em um único prompt.

Prompt

Apague as luzes da sala. Coloque uma sala quadriculada em preto e branco dentro de uma esfera de vidro que flutua acima da mão, dentro dela contém uma representação recursiva da mesma mão segurando a esfera, criando uma infinidade de salas recursivas. A câmera se aproxima lentamente da esfera, criando um loop de vídeo.

Vídeo de saída

Geração de cena de áudio nativa

Gemini Omni pode usar sinais de áudio como parte da instrução de geração, criando eventos visuais sincronizados com música ou interação.

Prompt

As luzes dos apartamentos começam a acender em sincronia com a música.

Vídeo de saída

Prompt

Adicione sons de harpa sincronizados quando toco cada folha de samambaia. Mude a estrutura da folha para que se assemelhe à vida vegetal bioluminescente 3D semitranslúcida, com vaga-lumes bioluminescentes voando ao redor dela e reagindo enquanto eu jogo.

Vídeo de saída

Conhecimento Mundial e Física

Gemini Omni está posicionado como geração de vídeo baseada no conhecimento do mundo real da Gemini, incluindo intuição física e conceitos explicáveis.

Prompt

Uma bola de gude rolando rapidamente em uma pista de reação em cadeia, tiro contínuo e suave.

Vídeo de saída

Prompt

Claymation explicador do enovelamento de proteínas, tudo é feito de argila, sem mãos, stop motion, preciso.

Vídeo de saída

Conteúdo cinematográfico social

Use prompts no estilo Gemini Omni para clipes sociais verticais, avatares de criadores, explicadores, vídeos remixados e recursos promocionais curtos.

Prompt

Crie vídeos com seu próprio avatar digital para que o clipe gerado tenha a sua aparência e som. Use-o para anúncios personalizados, narrativas sociais e conteúdo resumido.

Vídeo de saída

Fluxo de trabalho de vídeo de IA tradicional vs Gemini Omni

A narrativa da página de destino do Gemini Omni deve destacar a compactação do fluxo de trabalho: menos ferramentas separadas, mais referências multimodais e iteração mais fácil em linguagem natural.

Dimensão

Fluxo de Trabalho Tradicional

Gemini Omnidireção

Matriz 1

Ferramentas separadas de texto para imagem, imagem para vídeo, sincronização labial e edição de vídeo

Uma família de modelos de criação multimodal

Matriz 2

Transferência manual de referência entre ferramentas

Referências de texto, imagem, vídeo e áudio em um fluxo coeso

Matriz 3

Mais perda de consistência em cada etapa de geração

Edição conversacional com memória de cena

Matriz 3

Iteração de prompt mais difícil para edições em nível de cena

Adequado para geração de vídeo, remix, explicadores e conteúdo de avatar

Como usar Gemini Omni no Collart

Step 1

Selecione o modelo

Escolha a geração de vídeo multimodal estilo Gemini Omni na área do modelo de vídeo AI.

Step 2

Detalhes de entrada

Adicione um prompt e referências opcionais como imagem, vídeo ou áudio para orientar o clipe final.

Step 3

Gere seu vídeo

Pré-visualize o resultado, edite com linguagem natural e exporte para plataformas sociais.

Gerar agora

Perguntas frequentes

Transforme suas ideias em recursos visuais impressionantes

Gerar agora