von Patrick Schenk, 23.03.2022

Zwischen Kunst und KI

Die Technologie der künstlichen Intelligenz wird mit fortschreitender Zeit in immer mehr neue Anwendungsgebiete implementiert und erleichtert dem Menschen so das Leben. Wie das in künstlerischen Gefilden aussehen kann, zeigt sich beispielsweise mit GauGAN – einer KI-Software zum Malen und Zeichnen.

Selbstfahrende Autos, überraschend akkurate Online-Übersetzer, Sprach-Assistenten, personalisierte Web-Suchen und Smart Homes: Die künstliche Intelligenz (KI) hat uns in der kurzen Zeit, in der diese Technik in der Breite verwendet wird, schon Unmengen an Komfort und Hilfestellungen geboten – und das mit Erfolg. Da überrascht es nur wenig, dass uns das synthetische Hirnschmalz je länger je mehr auch in anderen Gefilden unter die Arme greift. Die Kunstbranche hat mit NVIDIAs GauGAN bereits vor drei Jahren ein neuartigen KI-Tool erhalten, das unter Zuhilfenahme von künstlicher Intelligenz aus einfachen, manuellen Bildschirmzeichnungen atemberaubende Bilder zaubern kann.

Katz, Maus – und KI
Das Transformationswunderwerk liegt einer neuen Technik zugrunde, die sich Generative Adverserial Network – kurz GAN – nennt. Im Unterschied zu einem normalen Deep-Learning-Netzwerk, das Fotos (beispielsweise eines Hundes) nur dann erkennen kann, wenn sie von einer Person genau gelabelt werden, baut das GAN auf einer Konkurrenzbeziehung zweier Plattformen auf: Ein Netzwerk («Generator») wird mit der Aufgabe betraut, gefälschte Bilder von Hunden zu erstellen, die aber wie echte aussehen. Das zweite Network («Diskriminator») untersucht die angefertigten Fotos und versucht zu bestimmen, ob diese echt oder gefälscht sind. Der Vorteil? Beide lernen voneinander und verbessern sich kontinuierlich: Der «Fälscher» resp. «Generator» fördert immer bessere Fälschungen zutage, der «Polizist» oder «Diskriminator» erkennt Fälschungen immer besser und gibt ersterem Pixel für Pixel Feedback. Ein weiterer Zugewinn bei diesem «Katz-und-Maus»-Spiel ist, dass sich der menschliche Zeitaufwand, der für die «Content-Fütterung» regulärer KIs anfällt, drastisch minimiert.

Text-to-Image im Test: Bei der Suchfeld-Eingabe geben wir «misty mountains» ein und erhalten tatsächlich neblige Berge.

Kreativität ausleben
Im Frontend bekommt man als Künstler von der Technologie im Hintergrund natürlich nichts mit. Der Fokus darf ganz und gar auf dem Kreieren liegen inkl. der überraschenden Ergebnisse, die via GauGAN auf die Mattscheibe gezaubert werden. Die Bearbeitungsmöglichkeiten sind dabei ungemein vielfältig. Es lassen sich beispielsweise bestehende Werke mittels einer Segmentierung editieren: Das bedeutet, dass gewisse Bereiche eines Fotos (z. B. der Himmel) ausgewählt und durch ein anderes Landschaftsobjekt (z. B. Schnee oder Nebel) ausgetauscht werden können. Wem das von GauGAN vorgeschlagene neue Firmament nicht gefällt, kann dieses mittels Stilvorlagen und Randomizer so lange ändern, bis das Foto zufriedenstellend ist.

Weiter bietet die KI-Anwendung von NVIDIA aber auch die Möglichkeit, von Grund auf selbst frisch ans Werk zu gehen: Die Web-App enthält die grundsätzlichen Gebäude- (Dächer, Zäune, Häuser etc.), Boden- (Strasse, Dreck, Sand etc.), Landschafts- (Hügel, Berge, Nebel etc.) und Pflanzenelemente (Blumen, Sträucher etc.) und erlaubt so das Zeichnen eines einfachen Bildes. Basierend auf der Darstellung kann dann ein echtes Bild – eine zufällig generierte KI-Illustration erstellt werden, die sich wiederum in weiteren Arbeitsschritten bearbeiten lässt.

Ein Künstler, der aufmuntert
Beim Zeichnen verzeiht GauGAN, das übrigens nach dem französischen Maler Paul Gauguin benannt ist, auch denjenigen, die weniger mit einer ruhigen Hand, chirurgischer Präzision oder künstlerischem Gedankengut gesegnet sind: Tatsächlich ermutigt die Software Mal-Einsteiger und gibt ihnen die Möglichkeit, aus eher groben Skizzen gewaltige und fotorealistische Meisterwerke hervorzubringen – und das funktioniert auch ausgesprochen gut: GauGAN erkennt resp. interpretiert die gezeichneten Objekte sehr zuverlässig.

Vor einigen Monaten, im November 2021, hat NVIDIA Version 2 der Software lanciert. Der Mal- und Zeichnungseditor bedient sich neu über 10 Millionen Referenzbildern und hat eine weitere zukunftsträchtige Bearbeitungsoption – den Text-Input – spendiert bekommen: Neben den erwähnten und weiteren Editing-Tools aus GauGAN lassen sich mit GauGAN2 nun auch Bilder aus (englischen) Texten fabrizieren. Wer das neue Input-Feld der Software z. B. mit «sandy beach with palm trees» oder «misty mountains» befüllt, kriegt genau das Gesuchte: Ein zufällig generiertes Landschafts-Szenario eines palmengesäumten Sandstrandes oder nebeliger Bergspitzen.

Wer sich selbst am KI-Zeichnungstool versuchen möchte, kann das entweder über die Web-App tun oder sich die Desktop-Applikation «NVIDIA Canvas» kostenlos herunterladen, wofür ein entsprechender NVIDIA-Prozessor vorausgesetzt wird.

Kommentieren

Kommentare lesen

Diesen Beitrag teilen

Autor Patrick Schenk
Rubrik Imaging
Dossier: Publisher 1-2022
Thema KI

Zwischen Kunst und KI

Kommentieren Antworten abbrechen