Ade AD? Sind künstliche Intelligenzen bald die neuen Art-Directors?

Lesezeit ca.
Minuten

Ade AD? Sind künstliche Intelligenzen bald die neuen Art-Directors?

Konzepte und Kompositionen zu entwickeln, sind die Schlüsselkompetenzen menschlicher Kreativprozesse – aber was, wenn das auch eine AI schafft? Wir erklären, warum die Software DALL-E ein Gamechanger ist.

Unser Bild zum Blogartikel wurde nicht von uns komponiert, sondern von einer AI. Die Vorgabe war: „Art Director desperately trying to be more creative than AI“. Das Ergebnis sehen Sie vor sich.

WALL-E + Salvador Dalí = DALL-E

Das Internet ist ein kurioser Ort. Das dürfte mittlerweile den meisten bekannt sein. Es gibt kaum Vorstellbares, das nicht in Bits und Bytes existiert. Jedoch kommt es auch mal vor, dass das Internet an seine Grenzen kommt, gerade im grafischen Bereich. Dann muss man seine Imagination eben selbst gestalterisch in die Realität umsetzen.

Seit Kurzem gibt es die Möglichkeit, Kreationen ohne Photoshop-Skills zu erschaffen. Die Rede ist von der künstlichen Intelligenz DALL-E. Der Name ist ein Kofferwort bestehend aus dem Protagonisten des gleichnamigen Pixar Films WALL-E und dem Künstler Salvador Dalí. DALL-E ist eine OpenAI Software, die Texteingaben in digitale Bilder umsetzt. In einem Blogpost im Januar 2021 wurde die erste GPT-3 Version der Öffentlichkeit präsentiert. Im April 2022 wurde die zweite Generation angekündigt, die hochauflösende Bilder mit Konzepten, Kompositionen und verschiedenen Styles kombinieren. Die ursprüngliche Version war auf craiyon.com nutzbar, aber die überarbeitete Neuauflage ist nun per Anmeldung verfügbar und setzt neue Standards.

Wie funktioniert DALL-E?

Um DALL-E zu nutzen, benötigt man lediglich einen Internetzugang und eine Idee. Diese wird bei der ersten Version als Text ins Suchfeld auf craiyon.com eingetragen, mit RUN bestätigt und 50 bis 60 Sekunden später erstellt DALL-E mehrere Bildvorschläge. Die AI nutzt Bilder aus dem Netz und erstellt daraus eigene Dateien. Style, Farbgebung, Komposition – jeder einzelne Schritt wird eigenständig umgesetzt. Der Vorstellungskraft sind dabei kaum Grenzen gesetzt.

Sicherlich hakt es noch an der einen oder anderen Stelle und zu komplexe Textvorgaben stellen DALL-E 1 vor größere Herausforderungen. Damit die eigene Umsetzung gelingt, ist es sicherer, die Anweisung auf Englisch zu formulieren. Aber die AI lernt mit jedem Bild, das es erstellt. Und sie lernt sehr schnell. Auf craiyon.com herrschte zeitweise so viel Traffic, dass User:innen oft warten mussten, bis ihre Ideen umgesetzt werden konnten. Es entstand ein Internet-Trend, der sämtliche Social-Media-Kanäle beherrschte. Hinter dem Trend steckt aber mehr als nur Fun and Games. Anders bei der zweiten Version hingegen sieht es schon aus.

Die Zukunft der Deepfakes?

Je realistischer der Output von DALL-E wird, desto größer wird das Potenzial, daraus Falschmeldungen und Deepfakes zu erstellen. Bei der neuen Version Dall-E 2 erreichen die Ergebnisse nämlich ein wesentlich höheres Level, so dass man genauer hinschauen muss, um zu erkennen, ob es sich um eine Animation oder die Realität handelt.

Die Betreiber:innen versicherten zwar, dass Inhalte wie sexualisierte oder gewaltverherrlichende Darstellungen blockiert werden, aber wie immer gibt es auch hier Grauzonen. Bereits in den ersten Testläufen der ursprünglichen Version zeichnete sich eine starke Tendenz ab, dass der Algorithmus häufig sexualisierte Darstellungen von Frauen abbildete. Man geht davon aus, dass die ersten Testproband:innen vermehrt nach solchen Inhalten suchten und der Algorithmus dadurch beeinflusst wurde.

Kann DALL-E bald Art-Directors ersetzen?

DALL-E ist im Vergleich zu früheren AIs autonomer und weist eigenständige kreative Denkmuster auf. Die Software kann Kompositionen entwickeln, interpretieren und sie dann gestalterisch verarbeiten. Andere künstliche Intelligenzen stießen dabei schnell an ihre Grenzen, aber DALL-E schaffte es, diese Lücken zu füllen. Das heißt, die AI hat ein Verständnis von visuellen Design-Trends.

Der US-amerikanische Professor Mark Riedl sagte, DALL-E schaffe es, Konzepte zu verschmelzen. Eigentlich eine Schlüsselkompetenz des menschlichen Kreativprozesses. DALL-Es visuelle Intelligenz reicht sogar so weit, dass es Ravens Progressive Matrizen, einen freien Multiple-Choice-Intelligenztest, lösen könnte.

Ravens Progressive Matrizen (auch bekannt als Ravens Matrizentest) sind sprachfreie Multiple-Choice-Intelligenztests. Sie erfassen die kognitiven Fähigkeiten einer Person. Bei den einzelnen Testaufgaben geht es darum, ein vorhandenes Muster zu verstehen und das darin fehlende Teil aus einer Reihe möglicher Teile richtig auszuwählen. Die Muster können in einer 4×4-, 3×3- oder 2×2-Matrix angeordnet sein.

Um eine echte Alternative im B2B oder B2C zu sein, ist es vielleicht noch etwas zu früh, aber die Entwicklung verläuft rasant. Die Limitationen der ersten Version beginnen bei komplexeren Anforderungen. Aus drei oder mehr im Kontext stehenden Begriffen, Angaben oder Zahlen kann die AI kaum realistische Umsetzungen generieren. Auf der Interpretationsebene stockt es ebenfalls. DALL-E braucht genaueste Informationen, um sie umsetzen zu können. Kurz gesagt: DALL-E arbeitet pragmatisch. Menschen hingegen können spontan auf Situation eingehen und situative Parameter besser einschätzen, um die Kreation zielsicher zu entwerfen. Bei der neuen Version hingegen werden die Hürden schon überschaubarer. Kompositionen, komplex verschachtelte Vorgaben sowie ultrarealistische Darstellungen sind nun möglich und werden binnen weniger Sekunden automatisch generiert.

Künstliche Intelligenzen im Kreativbereich sollten mit Spannung beobachtet werden. Momentan können sie Art-Directors noch nicht vollständig ersetzen, aber sie entwickeln sich stetig und schnell weiter. Die enorme Lernkapazität, die DALL-E 1 und 2 innerhalb kürzester Zeit entwickeln konnte, ist beeindruckend. Man darf also gespannt sein, wann AIs Aufgaben in der Kreativbranche eigenständig übernehmen werden.

Dennoch müssen ADs noch keine Angst haben, ersetzen zu werden. Das Gespür für Emotionen und situative Wandelbarkeit bleiben vorerst unangefochten. Wenn Sie einen Eindruck bekommen wollen, zu was unsere ADs fähig sind, schauen Sie gerne auf unserer Webseite vorbei und machen selbst ein Bild. Wir versprechen Ihnen, Sie werden Augen machen.

Zurück

Interesse geweckt?

Fragen, Feedback oder Themenwünsche?
Sprechen Sie uns an!