Notebookcheck Logo

Veo 3.1 und Flow: Google DeepMind rüstet KI-Filmer mit präziserer Kontrolle und nativem Audio auf

Veo 3.1 und Flow: Google DeepMind rüstet KI-Filmer mit präziserer Kontrolle und nativem Audio auf (Bildquelle: Google)
Veo 3.1 und Flow: Google DeepMind rüstet KI-Filmer mit präziserer Kontrolle und nativem Audio auf (Bildquelle: Google)
Google DeepMind stellt mit Veo 3.1 das neueste Modell seiner generativen Video-KI vor und integriert es mit erweiterten Bearbeitungsfunktionen und umfassender Audiounterstützung in das KI-Filmmaking-Tool Flow. Die Aktualisierung soll technisch versierten Anwendern einen nie dagewesenen Grad an künstlerischer Kontrolle über die Erstellung und Bearbeitung von Videoclips ermöglichen.

Google DeepMind hat signifikante Aktualisierungen für sein KI-Filmmaking-Tool Flow angekündigt, das von der generativen Video-KI Veo angetrieben wird. Diese Neuerung folgt auf die Generierung von über 275 Millionen Videos in Flow seit der Einführung vor fünf Monaten. Laut Google sei man dem Feedback der Nutzer nachgekommen, die sich mehr künstlerische Kontrolle und umfassende Audiointegration über alle Funktionen hinweg wünschten. Die zentrale Neuerung ist die Einführung von Veo 3.1, das auf dem Vorgängermodell Veo 3 aufbaut.

Technische Details und Verbesserungen des Veo 3.1 Modells

Veo 3.1 wird als State-of-the-Art-Modell deklariert, das primär drei Kernbereiche verbessert: reichhaltigeres Audio, stärkere narrative Kontrolle und verbesserter Realismus, der sich in der Wiedergabe von lebensechten Texturen manifestieren soll. Die technische Basis zeigt laut Google eine stärkere Prompt-Adhärenz und eine verbesserte audiovisuelle Qualität, insbesondere bei der Konvertierung von Bildern in Videos. Diese optimierte Generierungsqualität ist für Entwickler und Unternehmenskunden über die Gemini API und Vertex AI zugänglich.

Erweitertes Narrativ: Die Rolle von Audio in bestehenden Flow-Funktionen

Die wichtigste funktionale Erweiterung in Flow ist die erstmalige Integration von Audio in vormals stumme Funktionen. Diese experimentellen und sich in stetiger Verbesserung befindenden Features ermöglichen nun eine ganzheitliche Szenengestaltung:

Ingredients to Video 

Mit dieser Funktion lassen sich mehrere Referenzbilder ("Zutaten") nutzen, um Charaktere, Objekte und den Stil einer Szene zu steuern. Durch Veo 3.1 wird das resultierende Video nun mit reichhaltigem, generiertem Audio untermalt, um die visuelle Vision zu komplettieren.

Frames to Video 

Anwender können ein Start- und ein Endbild vorgeben. Flow generiert anschließend das nahtlose Video, das die beiden Frames überbrückt, was sich ideal für filmische Übergänge eignen soll. Auch hier erfolgt die Generierung inklusive passendem Audio.

Extend

Diese Funktion erlaubt die Erstellung längerer, nahtloser Aufnahmen, die an die Aktion des Originalclips anschließen und diese fortsetzen. Laut Google sollen Videos so eine Minute oder länger dauern können, wobei die Fortsetzung auf der letzten Sekunde des vorangegangenen Clips basiert, was für die Kontinuität von Einstellungsansichten ("establishing shots") von Nutzen sei.

 

Präzisions-Editing: Neue Werkzeuge für die Szenenbearbeitung

Flow erhält zudem neue Bearbeitungswerkzeuge, die eine präzisere nachträgliche Anpassung der generierten Inhalte ermöglichen sollen:

Insert

Dieses Werkzeug erlaubt das Einfügen neuer Elemente in jede Szene, von realistischen Details bis hin zu fantastischen Kreaturen. Flow bewerkstelligt dabei laut Hersteller eine komplexe Handhabung von Schatten und Szenenbeleuchtung, damit die hinzugefügten Elemente natürlich wirken.

Remove 

Für die nahe Zukunft ist die Funktion "Remove" angekündigt. Diese soll es ermöglichen, unerwünschte Objekte oder Charaktere nahtlos aus einer Szene zu entfernen. Flow soll anschließend den Hintergrund und die Umgebung so rekonstruieren, dass es aussieht, als wäre das Objekt nie vorhanden gewesen. Diese Funktion werde bald verfügbar sein.

 

Ausblick

Mit Veo 3.1 und den erweiterten, nun vollständig audiofähigen Funktionen in Flow zielt Google DeepMind darauf ab, die Möglichkeiten für das narrative Video-Storytelling substanziell zu erweitern. Die Fokussierung auf präzisere Bearbeitung und höhere Output-Qualität demonstriert den technologischen Wettlauf im Bereich der generativen Videomodelle. Es bleibt abzuwarten, wie das "Remove"-Feature in der Praxis komplexe visuelle Rekonstruktionen ohne sichtbare Artefakte meistert und inwiefern die native Audio-Generierung tatsächlich die im Prompt geforderte narrative Steuerung widerspiegelt.

Quelle(n)

static version load dynamic
Loading Comments
Diesen Artikel kommentieren / Antworten
Teilen Sie diesen Artikel, um uns zu unterstützen. Jeder Link hilft!
Mail Logo
> Notebook Test, Laptop Test und News > News > Newsarchiv > News 2025-10 > Veo 3.1 und Flow: Google DeepMind rüstet KI-Filmer mit präziserer Kontrolle und nativem Audio auf
Autor: Ulrich Mathey, 16.10.2025 (Update: 24.10.2025)