01 / Tworzenie konwersacji
Edycja wideo w języku naturalnym
Edytuj scenę, obiekt, kamerę, ruch, styl i materiały, po prostu opisując następną zmianę.
Gemini Omni Flash to nowy multimodalny model tworzenia firmy Google umożliwiający przekształcanie tekstu, obrazów, plików audio i wideo w wysokiej jakości filmy oparte na sztucznej inteligencji, a następnie edytowanie ich w języku naturalnym, po jednej instrukcji na raz.
Gemini Omni Flash to nowy multimodalny model tworzenia firmy Google umożliwiający przekształcanie tekstu, obrazów, plików audio i wideo w wysokiej jakości filmy oparte na sztucznej inteligencji, a następnie edytowanie ich w języku naturalnym, po jednej instrukcji na raz.
01 / Tworzenie konwersacji
Edytuj scenę, obiekt, kamerę, ruch, styl i materiały, po prostu opisując następną zmianę.
02 / Dowolne wejście
Połącz wiele referencji w jeden spójny wynik, zamiast przełączać się między oddzielnymi narzędziami AI.
03 / Pamięć scen
Każda edycja opiera się na poprzedniej, pomagając zachować spójność postaci, fizyki i kontekstu wizualnego.
04 / Wiedza o świecie
Twórz objaśnienia i znaczące sceny, korzystając ze zrozumienia nauki, kultury i historii Gemini.
05 / Fizyka
Generuj efekty obejmujące grawitację, energię kinetyczną, zmarszczki cieczy, rytm oświetlenia i powierzchnie odblaskowe.
06 / Odpowiedzialna sztuczna inteligencja
Filmy z osobistymi awatarami i przezroczystość treści generowanych przez sztuczną inteligencję są obsługiwane przez odpowiedzialny stos sztucznej inteligencji Google.
Oficjalne przykłady Gemini Omni pokazują, jak można przekształcić źródłowy film wideo za pomocą krótkich podpowiedzi w języku naturalnym. Poniższe komponenty wideo to grywalne elementy zastępcze wersji demonstracyjnych; podczas publikowania zastąp lokalne pliki MP4 oficjalnymi licencjonowanymi zasobami.
Zrób rzeźbę z bąbelków.
Kiedy osoba dotknie lustra, spraw, aby lustro pięknie falowało jak płyn, a ramię osoby zamieniło się w odblaskowy materiał lustrzany.
Przykłady Gemini Omni łączą transformację obiektu, rekursywną logikę sceny i zsynchronizowane działanie w jednym podpowiedzi.
Przyciemnij światła w pokoju. Umieść czarno-biały pokój szachownicy w szklanej kuli, która unosi się nad dłonią, a wewnątrz zawiera rekurencyjną reprezentację tej samej ręki trzymającej kulę, tworząc nieskończoną rekurencję pomieszczeń. Kamera powoli zbliża się do kuli, tworząc pętlę wideo.
Gemini Omni może wykorzystywać wskazówki dźwiękowe jako część instrukcji generowania, tworząc zdarzenia wizualne zsynchronizowane z muzyką lub interakcją.
Światła w apartamentach zaczynają się włączać synchronicznie z muzyką.
Dodaj dźwięki harfy zsynchronizowane z dotknięciem każdego liścia paproci. Zmień strukturę liścia, tak aby przypominał półprzezroczyste, bioluminescencyjne rośliny 3D, z latającymi wokół nich bioluminescencyjnymi świetlikami, które reagują podczas zabawy.
Gemini Omni jest pozycjonowany jako generacja wideo oparta na wiedzy Gemini ze świata rzeczywistego, w tym na intuicji fizycznej i możliwych do wytłumaczenia koncepcjach.
Marmur toczy się szybko po torze w stylu reakcji łańcuchowej, ciągłe, płynne ujęcie.
Wyjaśnienie glinowania składania białek, wszystko jest zrobione z gliny, bez rąk, zatrzymanie ruchu, dokładne.
Korzystaj z podpowiedzi w stylu Gemini Omni w przypadku pionowych klipów społecznościowych, awatarów twórców, objaśnień, filmów z remiksami i krótkich materiałów promocyjnych.
Twórz filmy z własnym cyfrowym awatarem, aby wygenerowany klip wyglądał i brzmiał jak Ty. Używaj go do spersonalizowanych ogłoszeń, opowiadania historii w mediach społecznościowych i krótkich treści.
Narracja na stronie docelowej Gemini Omni powinna podkreślać kompresję przepływu pracy: mniej oddzielnych narzędzi, więcej multimodalnych odniesień i łatwiejsza iteracja w języku naturalnym.
Step 1
Wybierz multimodalną generację wideo w stylu Gemini Omni z obszaru modeli wideo AI.
Step 2
Dodaj zachętę i opcjonalne odniesienia, takie jak obraz, wideo lub dźwięk, które poprowadzą końcowy klip.
Step 3
Podgląd wyniku, edycja w języku naturalnym i eksport na platformy społecznościowe.