Wir diskutieren schon seit geraumer Zeit über DALL-E, das generative Text-zu-Bild-KI-Tool von OpenAI. Es ist schon seit langem (zumindest seit langem im Hinblick auf generative KI) über die Weboberfläche unter verfügbar labs.openai.com. Aber vor kurzem hat OpenAI den Zugriff über chatgpt ermöglicht.
Außerdem: wie man mit midjourney erstaunliche Bilder und Kunstwerke erstellt
Ich beschloss, es selbst in die Hand zu nehmen und zu sehen, was es bewirken kann.
Aktivieren von DALL-E 3 in ChatGPT Plus
Wie die anderen Add-ons von ChatGPT ist die DALL-E-Funktion nur in ChatGPT Plus verfügbar. DALL-E 3 in ChatGPT Plus ist derzeit als Betaversion aufgeführt, Sie müssen es jedoch nicht im Bereich „Einstellungen“ aktivieren.
Außerdem: So optimieren Sie Ihre google-Suchen mit KI in Chrome
Sie müssen es aus dem GPT-4-Dropdown-Menü auswählen. Wenn Sie es auswählen, entfällt der Zugriff auf „Mit Bing durchsuchen“, „ChatGPT-Plugins“ und „Datenanalyse“.
Sobald Sie es für Ihre Sitzung abgehakt haben, müssen Sie ihm nur noch einige Eingabeaufforderungen geben.
Mal sehen, wozu wir DALL-E bewegen können
Das Ausgeben von Eingabeaufforderungen ist unkompliziert. Wie bei ChatGPT möchten Sie klare Eingabeaufforderungen bereitstellen. Und wie bei Midjourney und anderen Text-zu-Bild-Tools möchten Sie einige stilistische Informationen bereitstellen, wenn Sie einen Stil im Sinn haben.
Als erstes fragte ich nach einem fotorealistischen Mac mini auf einem Marmorsockel.
Ich habe vier Versionen zurückbekommen. Ich habe das dritte ausgewählt, indem ich darauf geklickt habe, und habe dieses größere Bild erhalten:
Wie Sie sehen, erinnert es stark an einen typischen Mac mini. Das Gehäuse ist etwas runder und die Anschlüsse sind nicht ganz richtig, aber es kommt auf jeden Fall nah dran. Ich war beeindruckt. So sehr, dass ich versuchte, DALL-E dazu zu bringen, eine Reihe von MacBook Pros herzustellen.
Stellen Sie sich vor, nachdem ich einen nahezu perfekten Mac mini erstellt habe, würde ich von ChatGPT die Antwort „Keine Macs für Sie“ erhalten:
Also habe ich versucht, DALL-E dazu zu bringen, Laptops ohne Markenstammbaum herzustellen. Folgendes habe ich zurückbekommen:
Für den Fall, dass Sie die Details nicht erkennen können, schauen wir uns das letzte Bild des Sets an
Aus irgendeinem Grund tröstete mich die Tatsache, dass ChatGPT es für angebracht hielt, zwei Laptops aus dem Jahr 1900 zur Verfügung zu stellen. Auch wenn ich mit DALL-E arbeitete, war die Fähigkeit von ChatGPT, selbstbewusste, aber völlig falsche Antworten zu liefern, immer noch vorhanden. Es fühlte sich an, als würde man zu einem alten Freund nach Hause kommen.
Eine praktische PowerPoint-Erstellungsmaschine
DALL-E in ChatGPT ist wesentlich eingeschränkter als sein eigenständiger Bruder und Midjourney. Sie können dort keine Bilder hochladen. Sie können ein Bild nicht schwenken und DALL-E das Bild erweitern lassen. Sie können Teile des Bildes nicht selektiv bearbeiten. Aber was ihm an Leistung fehlt, macht er durch Komfort wett.
Außerdem: 4 Möglichkeiten, wie generative KI die Creator Economy ankurbeln kann
Machen Sie das folgende Bild:
Wenn Sie für eine Folie ein Bild von jemandem benötigen, der im Heimbüro arbeitet, können Sie eines ganz schnell erstellen. Fairerweise muss man sagen, dass das Bild nicht gerade fotorealistisch aussieht, aber für die Verwendung in PowerPoint ist es auf jeden Fall gut genug.
Oder nehmen wir an, Sie möchten ein Meeting veranschaulichen, bei dem die Verkaufserlöse steigen. Hier ist eine kurze Eingabeaufforderung und vier Versionen, die so gerendert wurden, als wären sie einem Pixar-Cartoon entsprungen:
Natürlich sind im echten ChatGPT-Stil nur auf einem der Bilder tatsächlich vier Personen zu sehen, aber das ist in Ordnung. Eigentlich bevorzuge ich die vierte Version, die sechs Leute hat:
Notiz: Vielfalt kann ein Problem sein. Von den 22 von DALL-E 3 generierten Führungskräften scheinen nur zwei farbig zu sein. Wenn Sie Folien erstellen oder anderweitig Materialien produzieren, sollten Sie sich dieses Problems bewusst sein und DALL-E entsprechend anleiten.
Einige abschließende Gedanken
Hier bitteschön. Mit dem DALL-E-Add-on zu ChatGPT ist der Einstieg in Text-to-Image sehr einfach. Ich empfehle Ihnen, es auszuprobieren. Ich werde weiterhin mein kostenpflichtiges Midjourney-Konto behalten, da ich einige der erweiterten Funktionen für Projekte verwende, aber ich werde auf jeden Fall DALL-E in ChatGPT für schnelle Bilder nutzen und wieder verlassen.
Außerdem: Wie man mit Midjourney AI einen perfekten Gesichtstausch hinbekommt
Was ist mit dir? Haben Sie Text-zu-Bild-Tools verwendet? Welche? Welche Erfahrungen haben Sie gemacht? Lass es mich unten in den Kommentaren wissen.
Sie können meine täglichen Projektaktualisierungen in den sozialen Medien verfolgen. Abonnieren Sie unbedingt meinen wöchentlichen Update-Newsletter auf Substackund folgen Sie mir auf Twitter unter @DavidGewirtzauf Facebook unter Facebook.com/DavidGewirtzauf Instagram unter Instagram.com/DavidGewirtzund auf YouTube unter YouTube.com/DavidGewirtzTV.