Notebookcheck Logo

Google DeepMind Genie 3: Echtzeit-generierte 3D-Welten aus Textbefehlen

Google Deepmimd Genie 3: Echtzeit-generierte 3D-Welten aus Textbefehlen (Bildquelle: Google)
Google Deepmimd Genie 3: Echtzeit-generierte 3D-Welten aus Textbefehlen (Bildquelle: Google)
Google DeepMind präsentiert mit Genie 3 ein KI-Modell, das aus einfachen Texteingaben interaktive 3D-Welten in Echtzeit generiert. Genie 3 markiert einen wichtigen Fortschritt bei „World Models“ und eröffnet neue Anwendungsmöglichkeiten in Gaming, Bildung und Robotiktraining.

Im Vergleich zu Genie 2, das Interaktionen nur für 10 bis 20 Sekunden erlaubte, ermöglicht Genie 3 laut The Verge eine Echtzeit-Interaktion über mehrere Minuten. Nutzer können unmittelbar per Texteingabe auf die 3D-Welt einwirken, und diese Veränderungen bleiben beständig erhalten – selbst wenn die Szene verlassen und später wieder betreten wird. Diese erweiterte Konsistenz und Reaktionsfähigkeit markieren einen entscheidenden Fortschritt gegenüber früheren Modellen.

Dynamisch generierte Welten

Die generierten Welten werden in 720p-Auflösung bei 24 Bildern pro Sekunde dargestellt und können dynamisch verändert werden. Nutzer können beispielsweise das Wetter ändern, neue Objekte hinzufügen oder Charaktere erschaffen – alles durch einfache Texteingaben. 

Anwendungen und Potenziale

Genie 3 eröffnet vielfältige Anwendungsmöglichkeiten. Im Gaming-Bereich können Entwickler nun interaktive Umgebungen erstellen, ohne auf aufwendige Modellierungsprozesse angewiesen zu sein. In der Bildung können realistische Simulationen für Trainingszwecke genutzt werden. Ein weiteres vielversprechendes Einsatzgebiet ist das Training von KI-Agenten, die in den generierten Welten lernen, handeln und sich weiterentwickeln können.

Noch nicht perfekt

Trotz der beeindruckenden Fähigkeiten von Genie 3 gibt es laut Observer noch einige Einschränkungen. Die geografische Genauigkeit der simulierten Umgebungen ist noch nicht immer perfekt, und die Darstellung von Texten innerhalb der Welten ist derzeit nur eingeschränkt möglich. Zudem ist die Interaktion mit mehreren Agenten in derselben Umgebung noch nicht vollständig ausgereift. 

Verbreitung

Aktuell ist Genie 3 nur einer ausgewählten Gruppe von Forschern und Kreativen zugänglich. Google DeepMind plant, das Modell in naher Zukunft einer breiteren Öffentlichkeit zugänglich zu machen, um die Technologie weiter zu erforschen und zu verbessern.

Fazit

Google Genie 3 ist ein Schritt hin zu interaktiver KI-generierter Welten. Mit seiner Fähigkeit, aus einfachen Texteingaben komplexe, dynamische 3D-Umgebungen zu erschaffen, eröffnet es neue Möglichkeiten für zahlreiche Anwendungsbereiche. Während noch einige technische Herausforderungen bestehen, zeigt Genie 3 das Potenzial, die Art und Weise, wie wir mit virtuellen Welten interagieren, grundlegend zu verändern.

static version load dynamic
Loading Comments
Diesen Artikel kommentieren / Antworten
Teilen Sie diesen Artikel, um uns zu unterstützen. Jeder Link hilft!
Mail Logo
> Notebook Test, Laptop Test und News > News > Newsarchiv > News 2025-08 > Google DeepMind Genie 3: Echtzeit-generierte 3D-Welten aus Textbefehlen
Autor: Ulrich Mathey, 12.08.2025 (Update: 25.08.2025)