Leak: Bildgenerierung über Gemini wird vielleicht bald deutlich einfacher

Google arbeitet offenbar an einer neuen Funktion für seinen KI-Chatbot Gemini, mit der sich über den Nano Banana-Bildgenerator erzeugte Bilder direkt im Chat bearbeiten lassen. Entdeckt wurde das Feature im Rahmen einer Analyse der Google-App Version 17.8.59 durch Android Authority. Demnach sollen Nutzer künftig einzelne Bildbereiche markieren und anschließend per Textanweisung verändern können. Die Funktion ist derzeit noch nicht offiziell verfügbar, Android Authority konnte sie jedoch schon aktivieren und testen.
Das Markieren der Bereich ist bei der Bildbearbeitung mit KI-Tools ein wichtiger Schritt, um der KI zu zeigen, welcher Bereich bearbeitet werden soll. Anderenfalls kann es schnell passieren, dass andere Bildbereich ebenfalls verändert werden – und das nicht immer zu Positiven. Bislang war der Workflow deutlich umständlicher. Nutzer mussten ein generiertes Bild zunächst herunterladen, anschließend in einer anderen App wie Photoshop markieren und danach erneut hochladen.
Laut Android Authority sollen in Gemini erzeugte Bilder eventuell künftig mit einem Stift-Symbol erscheinen, über das sich ein Editor öffnen lässt, in dem Nutzer bestimmte Bereiche markieren oder einkreisen können. Nach der Markierung wird das Bild wieder in das Chat-Eingabefeld eingefügt. Anschließend können Nutzer per Prompt beschreiben, welche Änderung vorgenommen werden soll. Bei reinen Bild-KIs wie Midjourney oder DALL-E gibt es solche Funktionen schon länger. Eine Revolution wäre das also nicht, den Umgebung mit Gemini würde es aber trotzdem maßgeblich erleichtern.
Anzumerken ist, dass diese Informationen aus einem APK-Teardown stammen. Dabei wird der Code einer Android-App analysiert, um noch in Entwicklung befindliche Funktionen zu entdecken. Solche Features erscheinen jedoch nicht zwangsläufig in der finalen Version einer App. Solange eine offizielle Ankündigung seitens Google fehlt, gibt es keine Garantie, dass das Feature tatsächlich in Gemini integriert wird.
Quelle(n)
Bildquelle: Google







