DALL-E
DALL-E

Wird DALL-E die Kreativbranche auf den Kopf stellen?

DALL-E, das neueste Tool, das das Internet erobert, ist ein leistungsstarker KI-Bildergenerator, der vielen Creatives den Kopf verdreht hat.

DALL-E. Du hast den neuesten Trend wahrscheinlich schon gesehen, vor allem wenn du auf Twitter unterwegs bist: KI-generierte Bilder. Das Konzept des Tools ist ziemlich einfach – die Nutzer geben zwei beschreibende Wörter oder Sätze ein, die angeblich zwei völlig unterschiedliche Themen und Ideen darstellen. Denk an Darth Vader und Kätzchen oder Top Gun und was immer Du Dir vorstellen kannst. Dieses Tool kombiniert die beiden Sätze oder Ideen und erstellt individuelle Bilder, in denen die beiden miteinander verschmelzen und zu einem Originalbild werden. Stell Dir das wie automatisches Photoshoppen vor.

Man kann sich leicht vorstellen, wie so etwas ankommen würde. Es gibt unendlich viele Möglichkeiten für komische Paarungen und schockierende Bilder, die sich garantiert verbreiten werden.

Wie funktioniert das Tool, wer hat es entwickelt und was können wir in Zukunft von dieser Art von Apps erwarten?

Wie funktioniert DALL-E?

Die beliebteste App, die du derzeit in den sozialen Medien siehst, ist „DALL-E mini“ (bald auf Crayion.com zu finden). Sie erstellt Bilder in 9 Blöcken mit Variationen desselben seltsam aussehenden Themas. Die Ergebnisse sind so schräg, dass sie nicht hyperrealistisch sind. Sie sehen einfach wie seltsame Zeichnungen aus. . . fast.

DALL-E
Der 9-Bilder-Block ist die Standardausgabe von DALL-E mini. Jedes ist eine Variation desselben Themas.

Wer hat DALL-E entwickelt?

DALL-E wurde von OpenAI, einer gemeinnützigen KI-Forschungsorganisation (mitbegründet von Elon Musk), entwickelt und ist eine multimodale Implementierung von GPT-3 (generative pre-trained transformer) mit 12 Milliarden Parametern, die „Text gegen Pixel austauscht“. Das Tool wird auf „Text-Bild-Paare“ aus dem Internet trainiert. Im Grunde durchforstet es das Internet sehr schnell und verknüpft Sätze mit Bildern. Es nutzt „Zero-Shot“-Lernen, um aus einer Beschreibung und einem Hinweis eine Ausgabe zu erzeugen.

Wir mussten nachschlagen, was „Zero-Shot“-Lernen ist und fanden heraus, dass – wenn ein Computer lernt, was ein Pferd ist, aber nicht, was ein Zebra ist – Zero-Shot-Lernen ist die Idee, dass der Computer ableiten kann, dass ein Zebra wie ein gestreiftes Pferd aussieht. Er kann also eine Art Unterscheidung treffen. Das ist nicht viel anders, als wenn wir durch Deduktion zu Schlussfolgerungen kommen. . . oder?

Das Problem

Ähnlich wie bei der Reaktion auf Deepfakes gibt es auch hier einige Leute, die die Ethik hinter der ganzen Sache in Frage stellen. Es ist nicht schwer, diesen Standpunkt zu verstehen, denn jede Art von KI, die sich selbst erschafft, wird den Menschen aus verschiedenen Gründen ein wenig Unbehagen bereiten, z. B. wegen der Privatsphäre und der Moral.

Abgesehen von der Frage der Moral können wir nicht umhin, darüber nachzudenken, wie dies in Zukunft die Rolle von Fotografen, Retuscheuren und sogar Video-Filmern und -Editoren ersetzen könnte, da es immer einfacher wird, ihre Kompetenzen durch eine Technologie wie DALL-E zu ersetzen.

Angesichts der Bilder, die wir hier zeigen, denkst du vielleicht: „Ist das euer Ernst? Diese Bilder sehen aus wie ein frittierter Albtraum, der nur im Meme-Versum existieren kann, und nicht wie etwas Zusammenhängendes, Künstlerisches oder Professionelles!“. Das liegt daran, dass wir die kostenlose, nicht so fortschrittliche Version des Tools verwenden. Das stimmt – es gibt ein leistungsstärkeres Tool namens DALL-E 2, das mehr von seinen Nutzern verlangt und bestimmte Inhaltsbeschränkungen und -zulassungen regelt.

Wie sieht also ein leistungsfähigeres DALL-E aus? Nun, haltet euch fest.

DALL-E
Die Ausgabe des leistungsstärkeren DALL-E 2.

Dieses Bild stammt direkt von ihrer Website – eine Fallstudie für das Tool. Die Textbeschreibung lautete: „Ein Astronaut reitet auf einem Pferd in fotorealistischen Stil.“

Wie du siehst, geht es also nicht nur um „echt“ aussehende Fotos. Es gibt viele Variationen, wie deine Bilder aussehen können. Diese künstlerische Freiheit ist es, die unsere Fantasie beflügelt, denn die Möglichkeiten des Tools sind so fortschrittlich, dass es schwer vorstellbar ist, dass dieses Tool keine dauerhafte Anwendung in der Kreativbranche finden wird.

Auswirkungen auf Fotografie und Video

Auch wenn DALL-E keine konkrete Bedrohung für die Videoproduktion darstellt, ist es nicht schwer zu erkennen, wohin das führen könnte. Es gibt bereits eine Reihe von Tools zur Videoerstellung, die jedoch nicht in der Lage sind, das zu produzieren, was der durchschnittliche Filmemacher erstellen kann oder was in den Stock Video Galerien zu finden ist. Außerdem gibt es bereits eine Menge von KI-generierten Skripten und Geschichten, die allmählich in die Welt sickern, aber bisher hat noch niemand eine komplette Video- und Audiogenerierung in einem Paket angeboten.

Zudem ist auch leicht vorstellbar, wie diese Bedrohung für Creatives aussieht. Wenn ein Kunde an einer neuen Werbekampagne arbeitet und ein Wüstental mit einem gewundenen Fluss zur goldenen Stunde und einem geparkten Auto in der linken unteren Ecke der Straße haben möchte. . . Nun, sie könnten für dieses Shooting bezahlen, mit allem, was dazu gehört: Models, Location, Fotograf, Fotoassistenz, Unterkunft, Transport – die Liste ist lang. Oder sie könnten es selbst machen, ohne das Büro verlassen zu müssen, und dabei eine Menge Geld sparen.

Es gibt unzählige lustige Anwendungen für diese Art von Tools. Der Instagram-Account @lincoln_baiyeaux zum Beispiel postet Inhalte, die das Profil eines modernen „Filmfotografen“ nachbilden sollen. Dieser Account verwendet die gleichen Hashtags für Kodak-Stocks, alte Kameras und klischeehafte Slogans als Bildunterschriften. Der einzige Haken ist, dass keines der Bilder echt ist. Sie sind alle zu 100 % computergeneriert. Sogar „sein“ Profilbild ist computergeneriert. Es ist ein lustiges, komödiantisches Projekt, das Dich auch zum Nachdenken über das Potenzial dieser Technologie anregt, auch wenn die Folgen nicht immer positiv sind.

lincoln baiyeaux
@lincoln_baiyeaux ist ein Instagram-Profil, das Liebhabern der Filmfotografie nachempfunden ist. . . aber alles ist computergeneriert.

Die Idee von KI-generierten Nutzern ist allerdings nicht neu. Wir haben schon seit Jahren mit Bots in Kommentarspalten und Foren zu tun. Und es wird immer üblicher, dass Internetnutzer fast allem, was sie online sehen, skeptisch gegenüberstehen. Die meisten Creatives versuchen, ein gewisses Maß an Originalität und Spezifität für ihre eigene künstlerische Stimme zu erreichen, um gute und authentische Kunst zu schaffen. Also solche Kunst, die nicht maschinell nachgebildet werden kann.

Unsere Erfahrung

Jedes Mal, wenn wir die App benutzt haben, hätten unsere Reaktionen nicht seltsamer sein können. Als wir sie zum ersten Mal sahen, mussten wir meistens lachen. Dann ertappten wir uns dabei, wie wir sie einfach nur schweigend anstarrten, fast hypnotisiert von der Seltsamkeit.

Hier sind also ein paar unserer eigenen Kreationen in all ihrer verrückten, zufälligen Pracht.

dall-e
dall-e
DALL-E verknüpft Nicolas Cage mit einem Tornado. Sieht fast wie ein paar Filmausschnitte aus.
dall-e

Boba Fett, Barbie und die Bassgitarre

Nachdem wir ein paar Popkultur-Mashups ausprobiert hatten, wollten wir es mit einem Stockfoto versuchen, um zu sehen, womit wir es hier zu tun haben. Also gaben wir „Sonnenuntergang auf dem Berggipfel“ ein, und das ist das Ergebnis. .

Sonnenuntergang

Unser erster Gedanke war, dass es nicht schrecklich ist, aber auch nicht großartig – es ist einfach das, was wir erwartet haben.

Jetzt, wo wir wissen, was DALL-E ist, was es kann und wie es funktioniert, was denkst du? Wird es so bleiben? Wird es die kreative Landschaft für Profis und ihre Karrieren komplett verändern? Nur die Zeit wird es zeigen.