Als OpenAI ihre Text-KI GPT-3 präsentierten waren die Experten, Nutzer und Forscher begeistert. Selten hat man einen so eindrucksvollen Einsatz von KI gesehen, der selbstständig mit nur sehr geringen Informationen Texte schreiben kann. Nun legt das Forschungsnetzwerk noch eine Schippe drauf und bringt mit DALL-E eine Bild-KI heraus, die genauso erstaunlich ist, wie es schon ihr textbasierter Verwandter war.
Bei DALL-E, einem Wortspiel mit dem Namen des berühmten Künstlers Salvador Dalí, bringt OpenAI die Fähigkeiten ihres Textgenerators GPT-3 mit der Bildgenerierungsfähigkeit eines anderen Projektes, dem i-GPT, zusammen und erschafft etwas nie dagewesenes.
DALL-E kann mittels Texteingabe passende Bilder generieren und dabei nicht nur äußerst willkürliche Kombinationen, wie einen Rettich im Tutu, erstellen, sondern auch komplexe Illustrationen und Motive.
DALL-E im Einsatz (Quelle: Mixed)
DALL-E kann dabei mit realen und mit fiktiven Elementen arbeiten und auf Grund weniger Textzeilen Gemälde erstellen, die beinahe Künstlern wie Dalí persönlich gleichkommen. Auch bestehende Bilder können von DALL-E mit der entsprechenden Texteingabe angepasst und sogar von der Perspektive verändert werden.
Die Bild-AI im Einsatz (Quelle: Mixed)
Wie schon sein Vorgänger nutzt die Bild-AI Kontextinformationen, um die vorhandenen Informationen neu zu interpretieren und zu transformieren. Wann das System, zu dem bisher nur einige Beispielvideos existieren veröffentlicht wird oder ob es, ähnlich wie GPT-3, bald ersten Alpha- und Beta-Nutzern zur Verfügung steht, ist noch unklar.
Beitragsbild: OpenAI