Während OpenAIs Sora 2 in Deutschland und Österreich noch auf sich warten lässt, schraubt Google an der Leistung seines Konkurrenzmodells Veo. Nachdem Veo 3.1 seit Mitte Oktober verfügbar ist, wurde das Modell nun auch in die Gemini App für Mobil- und Desktopgeräte integriert. Mit dem neuesten Update adressiert Google jedoch auch eine der größten Herausforderungen: die präzise kreative Kontrolle. Wie Google über den offiziellen X-Account der Gemini App bekannt gab, können Nutzer ab sofort mehrere Referenzbilder zusammen mit ihren Text-Prompts hochladen.
Beispielsweise kann nun ein Bild als Referenz für den Charakter verwendet werden, ein anderes für den Hintergrund und ein drittes für den visuellen Stil. Mit dem Text-Prompt können dann genauere Anweisungen gegeben werden, wie diese Elemente kombiniert werden sollen.
Bekanntes Feature im neuen Gewand
Ganz überraschend kommt diese Funktion nicht, bereits im Oktober wurde in Googles KI-Filmmaking-Tool Flow die Funktion "Ingredients to Video" integriert. Nach dem letzten Update ist dieses Feature nun nicht mehr Googles spezialisierten Entwickler-Tools (Flow oder Vertex AI) vorbehalten, sondern direkt in der Gemini-App integriert.
Laut Google soll der Rollout der neuen Funktionen ab sofort beginnen.

















