30-mal schneller KI-Bilder erstellen: Dall-E 3 und Stable Diffusion abgehängt

30-fach schneller, aber auch gut: DMD. (Bild: github/tianweiy)

Die mehrstufigen Prozesse bekannter KI-Bildergeneratoren hat ein Team des MIT abgekürzt. So vergeht nicht nur ein Bruchteil der Zeit bis zum fertigen Bild. Auch benötigte Rechenleistung und Stromverbrauch sinken im Gleichschritt.

Mario Petzold, Veröffentlicht am 25.03.2024 🇺🇸 🇨🇳 ...

AI Science

Die Magie von Dall-E oder Stable Diffusion dürfte mittlerweile vertraut sein. Aus einer kurzen Beschreibung von Szene, Inhalt und vielleicht ein, zwei Anmerkungen entsteht ein mehr oder weniger realistisches Bild. Das lässt sich glücklicherweise meist als KI-generiertes Werk erkennen, erfüllt aber eben auch seinen Zweck: Ich muss nicht extra einen Hund auf ein Surfbrett stellen oder einen Fuchs in einen Astronautenanzug packen. Das gewünschte Bild ist nur ein paar Klicks entfernt.

Im Hintergrund handelt es sich jedoch um einen rechenintensiven Prozess aus zahlreichen Iterationen, stetige Wiederholungen des Algorithmus, um schlussendlich auf das gewünschte Bild zu kommen. Forschenden am MIT ist es hingegen gelungen, auf diese zahlreichen Zwischenschritte zu verzichten. Stattdessen entsteht die beschriebene Szenerie nach genau einem Arbeitsschritt.

So lässt sich ein vergleichbares Ergebnis erzielen, während die nötige Rechenleistung oder die Wartezeiten deutlich sinken. Parallel dazu wird auch weniger Strom benötigt, um das System namens "Distribution Matching Distillation (DMD)" anzutreiben. Übersetzt bedeutet das ungefähr "Verteilungsgerechte Destillation".

Oder bildlicher ausgedrückt: Die für das Training genutzten Bilder werden in gröbere Bereiche zerlegt. Damit ist die ungefähre Bildkomposition je nach Motiv festgelegt. Zudem wird die Wahrscheinlichkeit für verschiedene Bildelemente analysiert, um am Ende eine stimmige Szene zu erhalten.

Im Endeffekt werden Detailinformationen reduziert, die Komplexität wird herabgesetzt, sodass der Bildgenerator schlicht schneller wird. Statt 2 bis 3 Sekunden pro Bild vergehen so mit der gleichen Hardware etwa 100 Millisekunden - ein Dreißigstel.

Schaut man die Bilder genau an, ist die Reduzierung von Details gut erkennbar. Hintergründe sind leicht verwaschen, Bildelemente können sich wiederholen. Die Motive können teils trotzdem deutlich besser aussehen und sind als Gesamtwerk dennoch einfacher als KI-generiert oder zumindest künstlich zu erkennen. Noch ein positiver Effekt.

Neben dem Fuchsastronauten finden sich hier viele weitere Beispiele des DMD-Modells.

Erkennbar weniger Details rechts machen das Bild nicht weniger überzeugend. (Screenshot: tianweiy.github.io)

Quelle(n)

MIT, Github

Verwandte Artikel

Kritikpunkt Stromverbrauch. Der könnte mit neuer Technik rapide sinken. (Bild: pixabay/2427999)

Computer ohne Transistoren oder Silizium: 2D-Magnete mit überlegenen Eigenschaften 10.04.2024

Das Potential von Lichtwellenleitern ist noch längst nicht ausgeschöpft. (Bild: pixabay/Bru-nO)

301 Terabit an Glasfaser-Internetanschluss: Rekord mit bestehender Netzwerktechnik 09.04.2024

Der CEO von YouTube betont, dass die Nutzungsbedingungen der Plattform eingehalten werden müssen (Bild: OpenAI).

YouTube warnt OpenAI vor der Verwendung seiner Videos zum Training von KI-Modellen 06.04.2024

Neun Unternehmen haben das Konsortium gegründet, um innerhalb von acht Jahren mehr als 95 Millionen Menschen aus- und weiterzubilden, um den Bedarf an technischen Fähigkeiten im Zeitalter der KI zu decken (Quelle: generiert mit Dall-E 3).

Neun Großunternehmen gründen Konsortium, um die bevorstehenden Veränderungen in der Arbeitswelt durch den zunehmenden Einsatz von KI zu untersuchen 06.04.2024

Eine offizielle Bestätigung der geplanten Premium-Suche seitens Google gibt es nicht. Die einzigen Hinweise auf einen derartigen Plan stammen aus den anonymen Quellen der Financial Times. (Quelle: Google)

Google erwägt kostenpflichtige Premium-Suchfunktion 06.04.2024

Opera kündigt die Möglichkeit an, lokale LLMs herunterzuladen und zu verwenden (Bild: Opera).

Opera ermöglicht als erster Browser den Zugriff auf lokale LLMs 06.04.2024

Interessierte Entwickler können Anfragen zur Bearbeitung durch den KI-Assistenten Devin an Cognition Labs schicken (Bild: Cognition).

Erster KI-Softwareentwickler: Devin schreibt Code und kann komplette Programme generieren 05.04.2024

Einmal in der Luft, wird es schwer, CO2 wieder einzufangen. (Bild: pixabay/catazul)

CO2 nicht nur einfangen - lieber umwandeln und nutzen 05.04.2024

Der Nachfolger des Galaxy Book4 Pro soll dank Intel Lunar Lake deutlich schneller werden. (Bild: Samsung)

Samsung Galaxy Book5 Pro leakt in Benchmark-Datenbank mit Intel Lunar Lake und Arc Battlemage iGPU 03.04.2024

Im Wasser liegt die CO2-Konzentration wesentlich höher als in Luft, zum Glück. (Bild: pixabay/Pexels)

CO2 aus dem Meer filtern: Klimarettung per Ozean 30.03.2024

So ähnlich oder ganz anders, vielleicht viel simpler ist ein künstliches neurales Netz aufgebaut. (Bild: pixabay/geralt)

Neurale Netzwerke in KI weniger verknüpft als erwartet 27.03.2024

LATTE3D kann sehr spezifische Texteingaben interpretieren, um ein 3D-Modell zu erzeugen (Bild: NVIDIA).

NVIDIA stellt das generative KI-Modell LATTE3D als "virtuellen 3D-Drucker" vor 25.03.2024

Tage vorher gewarnt zu sein, statt überrascht zu werden, ist gar nicht schwer. (Bild: pixabay/distelAPPArath)

KI sagt Überschwemmungen vorher, weltweit 24.03.2024

Diagnose per Stimme: KI für Husten und Schnupfen: 23.03.2024

Unterschied zwischen klassischem und Quantencomputer. (Bild: Caltech)

Fehlersuche im Quantencomputer und wie man ein Qubit-System simuliert 21.03.2024

Die Segel sollen sich mit nahezu jedem Schiffstyp kombinieren lassen. (Bild: Cargill)

Hightech-Segel für Frachtschiffriesen: CO2-Einsparung noch ausbaufähig 20.03.2024

Loading Comments

Diesen Artikel kommentieren / Antworten

Ender-3 V3: 3D-Drucker mit Autolevi...

Q32G11ZNE: Sehr schneller Gaming-Mo...

Mario Petzold - Tech Writer - 417 Artikel auf Notebookcheck veröffentlicht seit 2021

Seit 1989 und einem Intel 8086 nutze ich Computer. Auch das Internet kenne ich noch, bevor College- und Uni-Netzwerke durch Firmen und Social Media verdrängt wurden. Die Faszination für die technischen Sprünge und gesellschaftlichen Auswirkungen ließ mich nicht mehr los. Insbesondere dem klassischen PC gilt mein größtes Interesse - und kaum weniger dem Laptop, in dem die Komponenten sich mit wenig Platz und Strom arrangieren müssen. So erscheint es nur konsequent, dass ich seit 2015 technische Ratgeber und Produktvorstellungen schreibe. Für das nötige Grundlagenwissen und das Verständnis für Zusammenhänge sorgt mein Physikstudium.

Kontakt: LinkedIn

Teilen Sie diesen Artikel, um uns zu unterstützen. Jeder Link hilft!

> Notebook Test, Laptop Test und News > News > Newsarchiv > News 2024-03 > 30-mal schneller KI-Bilder erstellen: Dall-E 3 und Stable Diffusion abgehängt

Autor: Mario Petzold, 25.03.2024 (Update: 25.03.2024)