Notebookcheck Logo

OpenAI präsentiert Sora: Ein KI-Modell, das aus Textanweisungen fotorealistische Videos erzeugen kann

OpenAI stellt Sora vor, das fotorealistische Text-zu-Video-Generierung möglich macht (Bild: OpenAI).
OpenAI stellt Sora vor, das fotorealistische Text-zu-Video-Generierung möglich macht (Bild: OpenAI).
Sora, das jüngste Projekt von OpenAI, betritt Neuland in der KI-Innovation, indem es Textanweisungen nahtlos in lebensechte Videos umsetzt. Trotz einiger kleinerer Unzulänglichkeiten beweist Sora sein Potenzial für das visuelle Geschichtenerzählen mit seiner Fähigkeit, fesselnde Szenen zu erzeugen - von Oldtimer-SUVs, die Berge hinauffahren, bis hin zu animierten Monstern. Das Modell steht derzeit einer begrenzten Anzahl von Personen zur Verfügung, die es auf Sicherheit und Risiken testen, sowie einigen Künstlern und Kreativen, um ein erstes Feedback zu erhalten.

OpenAI ist ein Pionier auf dem Gebiet der KI für Endnutzer und hat mit ChatGPT und DALL-E die Text- und Bildgenerierung revolutioniert. Mit seinem neuesten Angebot, Sora, will das Unternehmen nun in den Bereich der Text-zu-Video-Generierung vorstoßen und die Grenzen der KI-Kreativität weiter ausloten.

Sora ist in der Lage, Videos von bis zu einer Minute Länge mit komplexen Szenen mit "mehreren Charakteren", nuancierten Bewegungen und "detaillierten Hintergründen" zu produzieren - alles auf der Grundlage von Benutzeranweisungen. Die Ergebnisse sind erstaunlich realistisch und zeigen das unbestreitbare Potenzial der KI für das visuelle Storytelling.

In mehreren von OpenAI bereitgestellten Demonstrationen erweckt Sora die Eingabeaufforderungen mühelos zum Leben. Von einem alten Geländewagen, der durch bergiges Terrain fährt, bis zu einer skurrilen Szene mit einem flauschigen Monster, das neben einer schmelzenden Kerze sitzt, zeigen die generierten Videos eine bemerkenswerte Treue zu den gegebenen Anweisungen.

Aber auch Sora ist nicht fehlerfrei. In einigen Fällen gibt es kleine Unstimmigkeiten oder unrealistische Bewegungen, die auf verbesserungswürdige Bereiche hinweisen, wie zum Beispiel eine Szene, in der eine Katze von ihrem schlafenden Besitzer Frühstück verlangt. Während die Szene im Großen und Ganzen überzeugend dargestellt ist, können aufmerksame Beobachter subtile Bewegungen bemerken, die von der Realität abweichen, als der Besitzer aus dem Schlaf erwacht. Diese Unzulänglichkeiten verblassen jedoch vor der generellen Fähigkeit des Modells, eindrucksvolle visuelle Geschichten zu erzählen.

Ein schönes Beispiel ist die Darstellung eines flauschigen Monsters neben einer schmelzenden Kerze. Das Ergebnis sieht wirklich wunderschön aus, wie etwas aus einem Pixar-Film. Die komplizierten Details, wie z.B. die Textur des Fells der Kreatur, die sonst sehr schwer zu rendern gewesen wäre, zeigen Soras Fähigkeit, mit komplexen visuellen Elementen umzugehen.

Derzeit steht Sora einer ausgewählten Gruppe von "Red Teamern" zur Verfügung, deren Aufgabe es ist, die potenziellen Risiken und Auswirkungen zu bewerten. Darüber hinaus arbeitet OpenAI mit visuellen Künstlern, Designern und Filmemachern zusammen, um Feedback zu sammeln, das die allgemeine Nützlichkeit des Modells für Content Creators verbessern soll. Während Sora weiter verfeinert und evaluiert wird, verspricht es, die Videoerstellung zu demokratisieren und Geschichtenerzählern und Kreativen ein leistungsstarkes Werkzeug an die Hand zu geben, mit dem sie ihre Visionen zum Leben erwecken können (hier Samsung Galaxy Book3 360 bei Amazon kaufen).

Ein Standbild aus einem animierten Video eines pelzigen Monsters, generiert von Sora (Quelle: OpenAI)
Ein Standbild aus einem animierten Video eines pelzigen Monsters, generiert von Sora (Quelle: OpenAI)
Ein Standbild aus einem von Sora generierten Video eines alten Geländewagens, der einen Berg hinauffährt (Quelle: OpenAI)
Ein Standbild aus einem von Sora generierten Video eines alten Geländewagens, der einen Berg hinauffährt (Quelle: OpenAI)
Wie man in diesem Standbild sehen kann, ist Sora eindeutig nicht perfekt. Man beachte, dass der Arm der Dame nicht so aussieht, wie er aussehen sollte, wenn sie aufwacht (Quelle: OpenAI)
Wie man in diesem Standbild sehen kann, ist Sora eindeutig nicht perfekt. Man beachte, dass der Arm der Dame nicht so aussieht, wie er aussehen sollte, wenn sie aufwacht (Quelle: OpenAI)

Quelle(n)

Alle 1 Beträge lesen / Antworten
static version load dynamic
Loading Comments
Diesen Artikel kommentieren / Antworten
Teilen Sie diesen Artikel, um uns zu unterstützen. Jeder Link hilft!
> Notebook Test, Laptop Test und News > News > Newsarchiv > News 2024-02 > OpenAI präsentiert Sora: Ein KI-Modell, das aus Textanweisungen fotorealistische Videos erzeugen kann
Autor: Sambit Saha, 16.02.2024 (Update: 16.02.2024)