OpenAI präsentierte die dritte Version von ihm künstliche Intelligenz um Bilder aus Text zu generieren, was mehrere Verbesserungen und neue Funktionen mit sich bringt. Darunter fällt das auf VON-E 3 jetzt nativ integriert in ChatGPTsodass Benutzer besser erstellen können AufforderungenAnfrage oder Anweisung an ein Modell IA um eine Antwort direkt aus dem zu generieren Chatbot.
Nach Angaben des Startups Sam AltmanDieses Tool entwickelt sich im Vergleich zu seinem Vorgänger erheblich weiter, wenn es um die Interpretation von Benutzeranfragen geht. Tatsächlich können Sie bei der Erstellung eines Bildes das Chat-System bitten, es zu erstellen oder eine längere und detailliertere Angabe zu erstellen, die es DALL-E 3 ermöglicht, es besser zu interpretieren und präzisere Ergebnisse zu liefern.
Darüber hinaus wird es den Benutzern auch die Möglichkeit geben perfektionieren eine Kreation, als ob sie einen Künstler um Änderungen bitten würden, dank dieser Integration mit ChatGPT, das besser versteht, wie es sein sollte eine Szene komponieren und was ist die Verbindung zwischen den Elementen, die Teil davon sind?
DALL-E verwendet das sogenannte a Diffusionsmodell um vorherzusagen, wie ein Bild für eine bestimmte Anfrage gerendert werden soll. Bei ausreichend großen Mengen Datenkann komplexe, kohärente und ästhetisch ansprechende Bilder erzeugen.
Das Neue an Dall-E 3 ist, dass es einen Teil der Komplexität eliminiert, die zur Verfeinerung des an das Programm gesendeten Textes erforderlich ist „promptes Engineering“und ermöglicht es Benutzern, Verbesserungen über die Konversationsschnittstelle von ChatGPT einzuführen.
„Moderne Text-zu-Bild-Systeme neigen dazu, Wörter oder Beschreibungen zu ignorieren, was Benutzer dazu zwingt, Prompt Engineering zu erlernen. „DALL·E 3 stellt eine Weiterentwicklung unserer Fähigkeit dar, Bilder zu generieren, die genau dem von Ihnen bereitgestellten Text entsprechen“, sagt OpenAI.
Dieses Tool hat beispielsweise das folgende Bild als Reaktion auf erzeugt nächste Anfrage: „Eine Illustration eines menschlichen Herzens aus durchscheinendem Glas, das auf einem Sockel inmitten einer stürmischen See steht. Die Sonnenstrahlen durchdringen die Wolken, erhellen das Herz und offenbaren ein kleines Universum im Inneren. Das Zitat „Finde das Universum in dir selbst“ ist in fetten Buchstaben am Horizont eingraviert.“
Ein weiteres bemerkenswertes Ergebnis ist dieses surreales Bild das mit Hilfe von ChatGPT generiert wurde, aus diesem Vorschlag: „Eine weite Landschaft, die ausschließlich aus verschiedenen Fleischsorten besteht, breitet sich vor dem Betrachter aus. Zarte, saftige Hügel aus Roastbeef, Bäume aus Hähnchenschenkeln, Flüsse aus Speck und Schinkenfelsen schaffen eine surreale, aber appetitliche Szene. Der Himmel ist mit einer Peperoni-Sonne und Salamiwolken geschmückt.“
Normalerweise würde dies einen enormen, schnellen technischen Aufwand erfordern, doch bei Dall-E 3 ist ChatGPT für die Erstellung dieser anspruchsvolleren Nachricht verantwortlich.
DALL-E 3 verspricht bessere Ergebnisse, wenn Text einschließen innerhalb der Zeichnungen, aber auch im Umgang mit Teilen des menschlichen Körpers, die ich bisher nicht richtig interpretieren konnte. Zum Beispiel, Hände.
Darüber hinaus wurden strengere Sicherheitsmaßnahmen implementiert, um Voreingenommenheit abzumildern und die Verwendung des Tools zur Erstellung potenziell schädlicher Inhalte wie z. B. zu verhindern DeepfakesDabei kann es sich um ein Video, ein Bild oder einen generierten Ton handeln, der das Aussehen und den Ton einer Person nachahmt. Tatsächlich weigert sich das Tool, Bilder von Persönlichkeiten des öffentlichen Lebens anhand ihres Namens zu erstellen.
Offene KI berichtete außerdem, dass es Künstlern die Möglichkeit bieten wird, ihre Werke aus der zukünftigen Dall-E 3-Schulung zu entfernen, wodurch Benutzer auch daran gehindert werden, zu versuchen, ein Kunstwerk im Stil eines bekannten Künstlers zu erstellen, und es Hindernisse gibt, die Benutzer daran hindern, diese zu erstellen pornografische oder gewalttätige Kunstwerke.
Die neue Version der generativen KI wird im Oktober für Abonnenten von verfügbar sein ChatGPT Plus und Enterprise über seine API.