Man kommt kaum an den Schlagzeilen zur KI-basierten Bilderzeugung vorbei. Bildportale verbieten künstlich erzeugte Bilder, Künstler gewinnen Preise ohne einen Pinselstrich zu machen. Nun folgt der nächste logische Schritt auf die Erstellung statischer Bilder – die Erstellung von Bewegtbild. Ob Meta, Open AI oder Google, viele Unternehmen arbeiten an ihren ersten Lösungen, was teilweise zu lustigen Ergebnissen führt.
Imagen kennt das Netz bereits als Googles Möglichkeit aus Texten Bilder zu erstellen, doch die Erweiterung des im Mai vorgestellten Werkzeugs wird nun für die Videoerstellung verwendbar sein. Wie das Imagen-Team in einem aktuellen Paper verkündet hat, basiert das System auf einer „Kaskade von Diffusionsmodellen“. Wie schon bei der Bild-KI braucht das System nur eine Texteingabe und aus dieser erzeugt das System dann stufenweise hochauflösende Videos. Nachdem ein neuronales Netz ein erstes Video erstellt hat, folgen weitere Bearbeitungsetappen, die räumliche Wiedergabetreue und Dynamik kontinuierlich verbessern. Laut dem Google Team von Imagen sind aktuell bis zu 24 Bilder pro Sekunde mit einer HD Auflösung von 1280×768 Pixeln möglich.
Die genauen mathematischen und technischen Parameter hinter der neuesten Entwicklung des Tech-Konzerns lassen sich im Paper genau nachlesen. Auch welche Learnings sie unteranderem beim Einsatz des Textencoders T5-XXL hatten, welcher aus den eingegebenen Textvorlagen Sinn und Aufgabe ableitet.
Wie schon bei der Bild-KI Imagen, ist es auch beim Video-Tool nicht möglich die Möglichkeiten auszutesten. Das Team begründet dieses Vorgehen mit Sicherheitsbedenken, da problematische Bilder noch auszusortieren seien, damit es nicht zu einem potenziellen Missbrauch kommen kann. Das ist auch, so wenigstens die Annahme, auch dringend nötig, denn da das Modell mit frei verfügbaren Bildern aus dem Internet trainiert wurde, müssen nun erstmal explizite Inhalte herausgefiltert werden.
Doch wo geht die Reise hin? Ist es der Abgesang der Künstler und Kreativschaffenden, da nun nach Kunstwerken auch Filme voll automatisiert erstellt werden können oder wird es vielmehr ein Werkzeug sein, welches völlig neue Möglichkeiten eröffnet?