Pyramid Flow, ein Open-Source-KI-Videogenerator ist jetzt verfügbar
Pyramid Flow ist ein neues KI-Modell, das bereits in YouTube-Tutorial-Videos an Popularität gewonnen hat. Es wurde auf Open-Source-Datensätzen mit insgesamt rund 10 Millionen Videos trainiert. Pyramid Flow ist das Ergebnis eines Teams von KI-Forschern der Peking University, Kuaishou Technology und der Beijing University of Posts and Telecommunications und ist selbst Open-Source. Es unterliegt den Bedingungen der MIT-Lizenz und kann virtuelle hochauflösende (768p) Videoinhalte generieren. Besonders gut schneidet es jedoch bei der Verarbeitung von 384p-Videos ab. Laut seinen Entwicklern kann das Modell ein fünf Sekunden langes Video in weniger als einer Minute erstellen (unter Verwendung eines A100-Grafikprozessors in einer nicht spezifizierten Hardwarekonfiguration).
In bestimmten Szenarien übertrifft Pyramid Flow seine Konkurrenten. Bei der Bearbeitung bestimmter Textaufforderungen sind die Ergebnisse jedoch nicht immer zufriedenstellend. Wie bei vielen generativen KI-Anwendungen ist auch hier ein gewisses Maß an Zufälligkeit im Spiel. Ein großer Vorteil ist, dass das Modell wesentlich weniger Rechenleistung benötigt als vergleichbare Systeme, und da sein Code quelloffen ist, kann es von jedem in lokalen oder Cloud-Anwendungen eingesetzt werden, ohne Lizenzierungsprobleme zu verursachen.
Obwohl die KI-Forscher, die Pyramid Flow entwickelt haben und alle für das Training verwendeten Datensätze offengelegt haben, gibt es bisher keine Informationen zu möglichen Urheberrechtsfragen. Während einige Urheber von Inhalten behaupten, dass virtuelle Videos, die mithilfe von Open-Source-Material erstellt wurden, die Rechte von Urheberrechtsinhabern verletzen könnten, bietet Pyramid Flow dennoch Potenzial, um solche Inhalte präzise abzustimmen, ohne dass externe Parteien involviert werden müssen.
Interessierte, die sich mit KI aus einer Open-Source-Perspektive befassen möchten, können sich das Buch Open-Source AI: The Future of Data Research von J.D. TjonWolf bei Amazon für 9,22 Euro (Kindle) oder 12,59 Euro (Taschenbuch) sichern.
Quelle(n)
Pyramid Flow (on GitHub, via Tech Xplore)