Was ist Gemini Omni Flash?

Gemini Omni Flash ist das erste Modell in der Gemini Omni-Familie von Google, das mit der Videogenerierung und Konversationsvideobearbeitung beginnt.

Was unterscheidet Gemini Omni von Veo oder anderen Videomodellen?

Der Hauptseitenwinkel ist ein multimodaler Workflow: Gemini Omni kann Bilder, Audio, Video und Text als Eingabe kombinieren und dann Videos durch natürliche Sprache generieren und verfeinern.

Kann Gemini Omni Audio als Eingabe verwenden?

Der Artikel von Google zeigt Beispiele für die Verwendung von Musikrhythmen und Audio-Referenzen, weist jedoch darauf hin, dass nur Sprachreferenzen für den Start von Audio unterstützt werden und weitere Audio-Eingabetypen später eingeführt werden.

Kann ich die Showcase-Videos in der Produktion verwenden?

Dieser HTML-Code verweist jetzt auf Remote-MP4-Links zu Google Cloud Storage, die in den offiziellen Ankündigungsbeispielen von Gemini Omni verwendet werden. Behalten Sie die Namensnennung bei und überprüfen Sie die Nutzungsrechte vor der Produktionsfreigabe.

Gibt es eine Gemini Omni API?

Laut Google werden in den nächsten Wochen APIs für Entwickler und Unternehmenskunden verfügbar sein. Daher sollten Produktionskopien verfügbarkeitssichere Formulierungen verwenden, bis der Zugriff für Ihr Konto bestätigt wird.

Gemini Omni AI-Videogenerator

Gemini Omni Flash ist Googles neues multimodales Erstellungsmodell zur Umwandlung von Text, Bildern, Audio und Videos in hochwertige KI-Videos – und deren anschließende Bearbeitung in natürlicher Sprache, eine Anweisung nach der anderen.

Videobearbeitung in natürlicher Sprache: Bearbeiten Sie Szene, Objekt, Kamera, Bewegung, Stil und Materialien, indem Sie einfach die nächste Änderung beschreiben.
Text, Bild, Audio und Video: Kombinieren Sie mehrere Referenzen zu einer zusammenhängenden Ausgabe, anstatt zwischen separaten KI-Tools zu wechseln.
Multi-Turn-Konsistenz: Jede Bearbeitung baut auf der letzten auf und trägt dazu bei, dass Charaktere, Physik und visueller Kontext kohärent bleiben.
Wissensbasiertes Geschichtenerzählen: Erstellen Sie Erklärungen und bedeutungsvolle Szenen mit Geminis Verständnis von Wissenschaft, Kultur und Geschichte.
Präzise Bewegung und Materialien: Erzeugen Sie Effekte mit Schwerkraft, kinetischer Energie, Flüssigkeitswellen, Lichtrhythmus und reflektierenden Oberflächen.
Avatar + SynthID-Transparenz: Persönliche Avatar-Videos und KI-generierte Inhaltstransparenz werden durch den verantwortungsvollen KI-Stack von Google unterstützt.
Bearbeiten Sie Videos durch Konversation: Offizielle Gemini Omni-Beispiele zeigen, wie ein Quellvideo durch kurze Eingabeaufforderungen in natürlicher Sprache umgewandelt werden kann. Die folgenden Videokomponenten sind abspielbare Demo-Platzhalter. Ersetzen Sie die lokalen MP4-Dateien bei der Veröffentlichung durch offiziell lizenzierte Assets.
Fortgeschrittenes Sofortdolmetschen: Gemini Omni-Beispiele kombinieren Objekttransformation, rekursive Szenenlogik und synchronisierte Aktionen in einer Eingabeaufforderung.
Native Audioszenengenerierung: Gemini Omni kann Audio-Hinweise als Teil der Generierungsanweisung verwenden und so visuelle Ereignisse erzeugen, die mit Musik oder Interaktion synchronisiert sind.
Weltwissen und Physik: Gemini Omni ist als Videogeneration positioniert, die auf dem realen Wissen von Gemini basiert, einschließlich physischer Intuition und erklärbaren Konzepten.

Wählen Sie Modell aus: Wählen Sie im Bereich „KI-Videomodell“ die multimodale Videogenerierung im Omni-Stil von Gemini aus.
Eingabedetails: Fügen Sie eine Eingabeaufforderung und optionale Referenzen wie Bild, Video oder Audio hinzu, um den endgültigen Clip zu leiten.
Generieren Sie Ihr Video: Sehen Sie sich das Ergebnis in der Vorschau an, bearbeiten Sie es in natürlicher Sprache und exportieren Sie es für soziale Plattformen.

Google I/O 2026 · Multimodales KI-Video

Gemini Omni AI-Videogenerator

Entdecken Sie Anwendungsfälle

Was Gemini Omni anders macht

01 / Konversation schaffen

Videobearbeitung in natürlicher Sprache

Bearbeiten Sie Szene, Objekt, Kamera, Bewegung, Stil und Materialien, indem Sie einfach die nächste Änderung beschreiben.

02 / Beliebige Eingabe

Text, Bild, Audio und Video

Kombinieren Sie mehrere Referenzen zu einer zusammenhängenden Ausgabe, anstatt zwischen separaten KI-Tools zu wechseln.

03 / Szenenspeicher

Multi-Turn-Konsistenz

Jede Bearbeitung baut auf der letzten auf und trägt dazu bei, dass Charaktere, Physik und visueller Kontext kohärent bleiben.

04 / Weltwissen

Wissensbasiertes Geschichtenerzählen

Erstellen Sie Erklärungen und bedeutungsvolle Szenen mit Geminis Verständnis von Wissenschaft, Kultur und Geschichte.

05 / Physik

Präzise Bewegung und Materialien

Erzeugen Sie Effekte mit Schwerkraft, kinetischer Energie, Flüssigkeitswellen, Lichtrhythmus und reflektierenden Oberflächen.

06 / Verantwortungsvolle KI

Avatar + SynthID-Transparenz

Persönliche Avatar-Videos und KI-generierte Inhaltstransparenz werden durch den verantwortungsvollen KI-Stack von Google unterstützt.

Bearbeiten Sie Videos durch Konversation

Offizielle Gemini Omni-Beispiele zeigen, wie ein Quellvideo durch kurze Eingabeaufforderungen in natürlicher Sprache umgewandelt werden kann. Die folgenden Videokomponenten sind abspielbare Demo-Platzhalter. Ersetzen Sie die lokalen MP4-Dateien bei der Veröffentlichung durch offiziell lizenzierte Assets.

Prompt

Machen Sie die Skulptur aus Blasen.

Video ausgeben

Prompt

Wenn die Person den Spiegel berührt, lässt sich der Spiegel schön wie eine Flüssigkeit kräuseln, und der Arm der Person verwandelt sich in reflektierendes Spiegelmaterial.

Video ausgeben

Fortgeschrittenes Sofortdolmetschen

Gemini Omni-Beispiele kombinieren Objekttransformation, rekursive Szenenlogik und synchronisierte Aktionen in einer Eingabeaufforderung.

Prompt

Dimmen Sie das Licht im Raum. Platzieren Sie einen schwarz-weißen Schachbrettraum in einer Glaskugel, die über der Hand schwebt. Darin befindet sich eine rekursive Darstellung derselben Hand, die die Kugel hält, wodurch eine unendliche Rekursion von Räumen entsteht. Die Kamera nähert sich langsam der Kugel und erzeugt eine Videoschleife.

Video ausgeben

Native Audioszenengenerierung

Gemini Omni kann Audio-Hinweise als Teil der Generierungsanweisung verwenden und so visuelle Ereignisse erzeugen, die mit Musik oder Interaktion synchronisiert sind.

Prompt

Synchron zur Musik gehen die Lichter der Wohnungen an.

Video ausgeben

Prompt

Fügen Sie Harfenklänge hinzu, die synchronisiert werden, wenn ich jedes Farnblatt berühre. Ändern Sie die Blattstruktur so, dass alle halbtransparenten 3D-Biolumineszenzpflanzen ähneln, mit umherfliegenden biolumineszierenden Glühwürmchen, die reagieren, während ich spiele.

Video ausgeben

Weltwissen und Physik

Gemini Omni ist als Videogeneration positioniert, die auf dem realen Wissen von Gemini basiert, einschließlich physischer Intuition und erklärbaren Konzepten.

Prompt

Eine Murmel, die schnell auf einer Kettenreaktionsbahn rollt, kontinuierlicher, gleichmäßiger Schuss.

Video ausgeben

Prompt

Claymation erklärt die Proteinfaltung, alles ist aus Ton, keine Hände, Stop-Motion, präzise.

Video ausgeben

Social-Ready-Filminhalte

Verwenden Sie Aufforderungen im Gemini-Omni-Stil für vertikale soziale Clips, Ersteller-Avatare, Erklärungen, Remix-Videos und kurze Werbematerialien.

Prompt

Erstellen Sie Videos mit Ihrem eigenen digitalen Avatar, sodass der generierte Clip wie Sie aussieht und klingt. Verwenden Sie es für personalisierte Ankündigungen, Social Storytelling und Kurzinhalte.

Video ausgeben

Gemini Omni vs. traditioneller KI-Video-Workflow

Die Zielseitenerzählung von Gemini Omni sollte die Workflow-Komprimierung hervorheben: weniger separate Tools, mehr multimodale Referenzen und einfachere Iteration in natürlicher Sprache.

Dimension

Traditioneller Workflow

Gemini Omni-Richtung

Matura 1

Separate Tools für Text-zu-Bild, Bild-zu-Video, Lippensynchronisation und Videobearbeitung

Eine multimodale Modellfamilie zur Erstellung

Matura 2

Manuelle Referenzübertragung zwischen Werkzeugen

Text-, Bild-, Video- und Audioreferenzen in einem zusammenhängenden Fluss

Matura 3

Mehr Konsistenzverlust bei jedem Generierungsschritt

Konversationsschnitt mit Szenenspeicher

Matura 3

Schwierigere Eingabeaufforderungsiteration für Bearbeitungen auf Szenenebene

Geeignet für die Erstellung von Videos, Remixes, Erklärungen und Avatar-Inhalten

So verwenden Sie Gemini Omni auf Collart

Step 1

Wählen Sie Modell aus

Wählen Sie im Bereich „KI-Videomodell“ die multimodale Videogenerierung im Omni-Stil von Gemini aus.

Step 2

Eingabedetails

Fügen Sie eine Eingabeaufforderung und optionale Referenzen wie Bild, Video oder Audio hinzu, um den endgültigen Clip zu leiten.

Step 3

Generieren Sie Ihr Video

Sehen Sie sich das Ergebnis in der Vorschau an, bearbeiten Sie es in natürlicher Sprache und exportieren Sie es für soziale Plattformen.

Jetzt generieren

Häufig gestellte Fragen

Verwandeln Sie Ihre Ideen in atemberaubende Bilder

Jetzt generieren