Blogbilder generiert mit künstlicher Intelligenz

Für jeden Blogeintrag ein passendes Bild zu finden, ist manchmal recht schwierig. Das neue Programm Dall-E von OpenAI macht das nun einfacher. Aus Textbeschreibungen kreiert die künstliche Intelligenz Bilder in verschiedenen künstlerischen Stilrichtungen.

Manchmal habe ich sehr schnell ein passendes Bild und manchmal braucht es ein paar Versuche. Nachfolgend ein Beispiel, wie ich zum letzten Blogbild gekommen bin.

1. Idee für ein Bild

Ich habe mir überlegt, dass ich für den Blog zu Learning in Public ein Bild mit einem offenen Kopf mit einem Gehirn möchte.

2. Handzeichnung

Als erster Versuch, füttere ich Dall-E mit folgender Textbeschreibung:

“A hand drawn sketch of a head with an open top showing the brain”

Dall-E generiert jeweils vier Bilder. Dies ist das Resultat:

Erster Versuch mit Kopf und Hirn als Handzeichnung (Dall-E)

3. Eine offene Tür

Ich wollte jedoch gerne einen geöffneten Deckel auf dem Kopf. Also habe ich die Textbeschreibung angepasst.

“A hand drawn sketch of a head with an open skull door showing the brain inside”

Zweiter Versuch als Handzeichnung, fälschlicherweise mit einer Türe (Dall-E)

Leider hat Dall-E das nicht verstanden und generiert ein Bild mit einer offenen Tür.

4. Ein offener Kopf

Ich versuche nochmals eine kleine Änderung:

“A hand drawn sketch of a head with an open skullcap showing the brain inside”

Dritter Versuch als Handzeichnung (Dall-E)

Nun kommen wir der Sache näher. Das erste Bild gefällt mir, aber das Hirn sieht eher aus wie ein Truthahn auf einem Teller.

5. Neue Variationen

Man kann Dall-E auch ein Bild geben und ihn davon Variateionen genereiren lassen. Ich wähle das erste Bild und lasse ihn vier Varianten davon erstellen:

Hier gefällt mir das dritte Bild. Aber dann entscheide ich mich, doch noch etwas Farbe in die Sache zu bringen.

6. Im Stil von Johannes Vermeer

Irgendwo sehe ich ein Beispielbild von Johannes Vermeer. Also schaue ich mal, ob Dall-E ein Bild im Stil von Vermeer erstellen kann.

“An open head showing the brain by Johannes Vermeer”

Ergebnis im Stil von Johannes Vermeer (Dall-E)

Hmmm. Das mit dem Hirn hat nicht funktioniert. Johannes Vermeer hat in der Mitte des 17. Jahrhunderts gelebt. Hat Vermeer vielleicht noch nicht so genau gewusst, wie ein Hirn aussieht?

7. Zweifel an meinen Englischkenntnissen

Dann starte ich nochmals einen Versuch mit Vermeer:

“a head with an open skullcap showing the brain inside by Johannes Vermeer”

Zweiter Versuch im Stil von Johannes Vermeer (Dall-E)

Gar nicht das, was ich wollte. Als ich mal nachschlage, was “skullcap” auf Deutsch heisst, finde ich heraus, dass es eine Kappe ist. Vielleicht sollte ich an meinen Englischkenntnissen arbeiten.

8. Cyberpunk

Dann sehe ich noch ein Beispielbild im Cyberpunk-Stil. Das interessiert mich und so versuche ich folgenden Text:

“a cyberpunk illustration of an open head with a brain”

Kopf mit Hirn im Cyberpunk-Stil (Dall-E)

Cool! Vor allem das vierte Bild gefällt mir. Doch der Deckel passt nicht wirklich auf den Kopf.

9. Einen Teil neu generieren

Bei Dall-E kann man auch mit dem Radiergummi einen Teil des Bildes auslöschen und nur diesen Teil neu generieren lassen. Also lösche ich den Deckel raus und bemühe die künstliche Intelligenz ein weiteres Mal.

Cyberpunk mit neu generiertem Deckel (Dall-E)

Beim ersten sieht man gar kein Hirn. Das zweite Bild – hä, keine Ahnung, was das war. Beim dritten ist das Hirn zu klein. Das vierte Bild ist genial. Was für ein Hirn! Wie nur kommt Dall-E auf eine solche Visualisierung?

10. Endergebnis

Ich nehme dieses Bild und weil ich für den Blog lieber ein Bild mit Querformat nutze, erweitere ich es mit Photoshop auf beiden Seiten. Das könnte man auch mit Dall-E machen, aber weil ich dort nur eine Farbe möchte, kann ich das ohne künstliche Intelligenz.

Dies ist das Endergebnis, welches ich im Blogeintrag Learning in Public schliesslich verwende:

Endergebnis eines Kopfes mit Hirn im Cyberpunk-Stil (Dall-E)

Dafür habe ich nun einige Versuche benötigt. Aber ich hatte auch einfach Spass und wollte ein paar unterschiedliche Varianten ausprobieren.

Was meinst du zu diesem Bild und zur Verwendung von Dall-E für Blogbilder?