image image


image

DALL-E: Generative Kunst und Künstliche Künstlerische Intelligenz

Das letzte Mal als ich etwas mit Bildern, die von einer Künstlichen Intelligenz erzeugt werden, hier im Schockwellenreiter hatte, war, als ich mit Googles Deep Dream Generator experimentierte und überall nur Hundeköpfe sah. Doch die Entwicklung ist nicht bei den Hundeköpfen stehen geblieben und so kam mir heute DALL-E unter:

Wie mir die Wikipedia erkärte, ist DALL-E ein Programm für künstliche Intelligenz, das Bilder aus Textbeschreibungen erstellt. Es verwendet eine 12-Milliarden-Parameter-Version des GPT-3-Transformer-Modells, um Eingaben in natürlicher Sprache zu interpretieren und entsprechende Bilder zu erzeugen. Leider hat OpenAI – die Firma hinter DALL-E – für keines der Modelle den Quellcode veröffentlicht, obwohl ein »Controller« von DALL-E auf der Website von OpenAI verfügbar ist, wo die Ausgabe einer begrenzten Auswahl von Beispiel-Prompts eingesehen werden kann. Open-Source-Alternativen, die mit kleineren Datenmengen trainiert wurden, wie DALL-E mini, wurden von anderen veröffentlicht.

DALL-E respektive DALL-E mini hat natürlich die Phantasie und Experimentierfreude bei einigen angeregt. So hat Scott Alexander ausprobiert, was herauskommt, wenn man DALL-E bittet, Bleiglasfenster zu zeichnen. Die Ergebnisse sind verbüffend. Noch tiefer in die generative Kunst ist der Merzmensch mit seinem ausführlichen Artikel »DALL-E: die Künstliche Künstlerische Intelligenz in Aktion« (Medium.com-Link) eingestiegen und war begeistert.

DALL-E gehört übrigens erfreulicherweise zu den Projekten, die NFTs den Stinkefinger zeigen und die Nutzung der generierten Bilder als NFT explizit verbieten. Eine nichtkommerzielle Nutzung der mit DALL-E geschaffenen »Werke« ist aber erlaubt.

DALL-E mini ist eine abgespeckte, freie (Apache-2.0-Lizenz) Version von DALL-E. Die Software steht kostenlos im Browser zur Verfügung. Ihr könnt das Tool sowohl am Computer als auch am Smartphone nutzen. Ich vermute, daß die meisten im Netz veröffentlichten Bilder mit DALL-E mini erstellt wurden. Und es gibt auch (mindestens) eine, auf DALL-E mini basierende Version zum selber hosten.

Natürlich hat der Erfolg von DALL-E auch Google auf den Plan gerufen. Der Schöpfer von Deep Dream hat mit Imagegen ein Konkurrenzprodukt entwickelt und als weitere Alternative steht Midjourney in den Startlöchern.

Das alles wirft natürlich auch grundsätzliche Fragen auf, die in dem Beitrag »Creating art with the help of artificial intelligence: Is AI the future of art?« eher angerissen als beantwortet werden. Dafür ist die Entwicklung auch noch zu jung. Aber es ist wichtig – siehe NFTs – daß die Fragen gestellt werden.

[Update]: Das Thema lag wohl in der Luft. Denn kaum hatte ich diesen Beitrag hochgeladen, erreichte mich über eines der vielen sozialen Kanäle der Hinweis auf den 35-minütigen Vodcast aus der Reihe K.I. Krimis »Kann Künstliche Intelligenz kreativ sein«? Ob Dr. Jaromir Konecny dort die Fragen beantwortet, weiß ich (noch) nicht, denn Pod- und Vodcasts unterliegen dem Nachteil vieler linearer Medien, daß man sie nicht überfliegen kann, um sich einen ersten Eindruck zu verschaffen. Aber die Fragen werden laut Videobeschreibung gestellt und darum wollte ich Euch den Hinweis nicht vorenthalten.

Eigentlich beschäftige ich mich momentan ja vorrangig mit dem Thema »Retrogaming und Künstliche Intelligenz«. Aber ich kenne mich, ich bin ein Spielkalb. Daher ist nicht auszuschließen, das ich Euch in naher Zukunft mit den Ergebnissen meiner eigenen Experimente mit DALL-E (mini) behelligen werde. Still digging!

image

Literatur


(Kommentieren) 

image image



Über …

Der Schockwellenreiter ist seit dem 24. April 2000 das Weblog digitale Kritzelheft von Jörg Kantel (Neuköllner, EDV-Leiter Rentner, Autor, Netzaktivist und Hundesportler — Reihenfolge rein zufällig). Hier steht, was mir gefällt. Wem es nicht gefällt, der braucht ja nicht mitzulesen. Wer aber mitliest, ist herzlich willkommen und eingeladen, mitzudiskutieren!

Alle eigenen Inhalte des Schockwellenreiters stehen unter einer Creative-Commons-Lizenz, jedoch können fremde Inhalte (speziell Videos, Photos und sonstige Bilder) unter einer anderen Lizenz stehen.

Der Besuch dieser Webseite wird aktuell von der Piwik Webanalyse erfaßt. Hier können Sie der Erfassung widersprechen.

Diese Seite verwendet keine Cookies. Warum auch? Was allerdings die iframes von Amazon, YouTube und Co. machen, entzieht sich meiner Kenntnis.


Werbung

Diese Spalte wurde absichtlich leergelassen!


Werbung


image  image  image
image  image  image


image