01 / Criação conversacional
Edição de vídeo em linguagem natural
Edite cena, objeto, câmera, movimento, estilo e materiais simplesmente descrevendo a próxima alteração.
Gemini Omni Flash é o novo modelo de criação multimodal do Google para transformar texto, imagens, áudio e vídeos em vídeos de IA de alta qualidade – e depois editá-los por meio de linguagem natural, uma instrução por vez.
Gemini Omni Flash é o novo modelo de criação multimodal do Google para transformar texto, imagens, áudio e vídeos em vídeos de IA de alta qualidade – e depois editá-los por meio de linguagem natural, uma instrução por vez.
01 / Criação conversacional
Edite cena, objeto, câmera, movimento, estilo e materiais simplesmente descrevendo a próxima alteração.
02 / Qualquer entrada
Combine várias referências em uma saída coesa em vez de alternar entre ferramentas de IA separadas.
03 / Memória de cena
Cada edição se baseia na anterior, ajudando os personagens, a física e o contexto visual a permanecerem coerentes.
04 / Conhecimento mundial
Crie explicadores e cenas significativas usando a compreensão de ciência, cultura e história de Gemini.
05 / Física
Gere efeitos envolvendo gravidade, energia cinética, ondulações líquidas, ritmo de iluminação e superfícies reflexivas.
06 / IA responsável
Vídeos de avatares pessoais e transparência de conteúdo gerado por IA são suportados pela pilha de IA responsável do Google.
Os exemplos oficiais do Gemini Omni mostram como um vídeo de origem pode ser transformado por meio de instruções curtas em linguagem natural. Os componentes de vídeo abaixo são marcadores de demonstração jogáveis; substitua os arquivos MP4 locais por ativos licenciados oficiais ao publicar.
Faça a escultura com bolhas.
Quando a pessoa toca o espelho, faça o espelho ondular lindamente como um líquido, e o braço da pessoa se transformará em um material espelhado reflexivo.
Os exemplos do Gemini Omni combinam transformação de objetos, lógica de cena recursiva e ação sincronizada em um único prompt.
Apague as luzes da sala. Coloque uma sala quadriculada em preto e branco dentro de uma esfera de vidro que flutua acima da mão, dentro dela contém uma representação recursiva da mesma mão segurando a esfera, criando uma infinidade de salas recursivas. A câmera se aproxima lentamente da esfera, criando um loop de vídeo.
Gemini Omni pode usar sinais de áudio como parte da instrução de geração, criando eventos visuais sincronizados com música ou interação.
As luzes dos apartamentos começam a acender em sincronia com a música.
Adicione sons de harpa sincronizados quando toco cada folha de samambaia. Mude a estrutura da folha para que se assemelhe à vida vegetal bioluminescente 3D semitranslúcida, com vaga-lumes bioluminescentes voando ao redor dela e reagindo enquanto eu jogo.
Gemini Omni está posicionado como geração de vídeo baseada no conhecimento do mundo real da Gemini, incluindo intuição física e conceitos explicáveis.
Uma bola de gude rolando rapidamente em uma pista de reação em cadeia, tiro contínuo e suave.
Claymation explicador do enovelamento de proteínas, tudo é feito de argila, sem mãos, stop motion, preciso.
Use prompts no estilo Gemini Omni para clipes sociais verticais, avatares de criadores, explicadores, vídeos remixados e recursos promocionais curtos.
Crie vídeos com seu próprio avatar digital para que o clipe gerado tenha a sua aparência e som. Use-o para anúncios personalizados, narrativas sociais e conteúdo resumido.
A narrativa da página de destino do Gemini Omni deve destacar a compactação do fluxo de trabalho: menos ferramentas separadas, mais referências multimodais e iteração mais fácil em linguagem natural.
Step 1
Escolha a geração de vídeo multimodal estilo Gemini Omni na área do modelo de vídeo AI.
Step 2
Adicione um prompt e referências opcionais como imagem, vídeo ou áudio para orientar o clipe final.
Step 3
Pré-visualize o resultado, edite com linguagem natural e exporte para plataformas sociais.