OpenAI gab das bekannt DALL-E 3 ist jetzt für chatgpt Plus-Benutzer verfügbar. Wie vor einigen Wochen bekannt wurde, wurde künstliche Intelligenz zur Generierung von Bildern aus Text nativ in den beliebten Chatbot integriert. Nutzer mit einem kostenpflichtigen oder Business-Abonnement können ab heute auf die neue Version zugreifen.
In ein im Blog veröffentlichter Eintrag Das erklärte OpenAI ausreichende Sicherheitsmaßnahmen entwickelt haben um sein neues Modell für mehr Benutzer zu öffnen. Mit DALL-E 3 können Sie Bilder aus Anweisungen in natürlicher Sprache erstellen (prompt) innerhalb von ChatGPT. Im Vergleich zur Vorgängerversion hat sich die Intelligenz erheblich weiterentwickelt, insbesondere bei der Interpretation der Teile des menschlichen Körpers.
Laut OpenAI, DALL-E 3 kann auf umfangreiche Eingabeaufforderungen reagieren und stellt auch komplizierte Details zuverlässig dar, einschließlich Text, Hände und Gesicht. Möglich wurde dies durch die Perfektionierung der Untertitelungstechnologie, die für die Übersetzung eines Eingabebildes in eine Textbeschreibung verantwortlich ist. Später nutzte das Unternehmen es, um DALL-E 3 zu trainieren. Auf diese Weise achtet das Modell stärker auf die Anweisungen des Benutzers.
Ein wichtiges Detail ist das Mit DALL-E 3 können Sie jetzt das Seitenverhältnis ändern in deinen Bildern. Dies war einer der ständigen Kritikpunkte der Nutzer, da die Vorgängerversion auf die Erstellung von 1:1-Inhalten (quadratisch) beschränkt war. Es ist nun möglich, das horizontale oder vertikale Verhältnis im anzuzeigen prompt das ChatGPT.
Um den Start von DALL-E 3 zu feiern, zeigte OpenAI Beispiele dafür, welche Bilder seine künstliche Intelligenz erzeugen kann. In einem davon bittet der Benutzer ChatGPT, fotorealistische Bilder von Wolken zu erstellen, die für eine Schulaufgabe verwendet werden sollen. Ein anderer schlägt eine Webdesign-Oberfläche und Logos vor.
DALL-E 3 wird weitere Sicherheitsbarrieren hinzufügen
Generative KIs wie DALL-E, midjourney oder Stable Diffusion sind seit ihren ersten Versionen im Auge des Sturms. Zusätzlich zu den Urheberrechtsklagen, mit denen einige von ihnen konfrontiert sind, gibt es noch weitere Bedenken hinsichtlich der von ihnen produzierten Inhalte. Obwohl viele über Sicherheitsgeländer verfügen, schaffen es einige, anstößige Bilder zu erzeugen.
Mit der Ankunft von DALL-E 3 auf Bing fanden zahlreiche Benutzer einen Weg, den 11. September zurückzubringen. Ein Bericht von 404 Enthält Illustrationen von SpongeBob Schwammkopf und anderen Charakteren, die ein Flugzeug über New York steuern, mit dem Ziel, in die Twin Towers zu stürzen. Dies zwang Microsoft dazu, die Richtlinien anzupassen, um diesen Inhalt in seiner Suchmaschine zu vermeiden.
Zum Start von DALL-E 3 auf ChatGPT Plus hat OpenAI dies bekannt gegeben Sie implementierten ein mehrstufiges Sicherheitssystem um die Erstellung potenziell schädlicher Bilder einzuschränken. Das bedeutet Wir werden nicht in der Lage sein, gewalttätige, sexuelle oder Inhalte zu erstellen, die Persönlichkeiten des öffentlichen Lebens einbeziehen von seinem Namen. Letzteres wurde verstärkt, um die Verbreitung gefälschter Nachrichten wie die Verhaftung von Donald Trump oder Papst Franziskus, der Balenciaga trägt, zu verhindern.
Die neue Version der künstlichen Intelligenz Es kann auch keine Inhalte im Stil lebender Künstler generieren, eine Funktion, die darauf abzielt, Kritik und rechtliche Probleme zu reduzieren. OpenAI wurde von der Kunstszene dafür kritisiert, dass es sein Modell mit urheberrechtlich geschützten Bildern trainiert, ohne die ursprünglichen Autoren um Zustimmung zu bitten.