OpenAI hat kürzlich Details zu DALL·E 3 bekannt gegeben, der neuesten Version des Text-zu-Bild-KI-Systems, die diesen Herbst auf chatgpt Plus, ChatGPT Enterprise, Bings AI Image Creator und Microsoft Designer verfügbar sein wird.

Dieses Update verspricht eine verbesserte Bildgenauigkeit, größere Nuancen und Aufmerksamkeit für den vom Benutzer eingegebenen Text.

Was ist neu bei DALL·E 3?

Bei früheren Iterationen von DALL·E mussten Benutzer ihre Eingabeaufforderungen durch einen Prozess namens „Prompt Engineering“ verfeinern.

DALL·E 3 zielt darauf ab, diesen Aufwand zu beseitigen, indem Bilder generiert werden, die den anfänglichen Textanweisungen des Benutzers besser entsprechen.

YouTube Video

Während DALL·E 2 beispielsweise einen vage verschwommenen Basketballspieler darstellen könnte, erstellt DALL·E 3 eine ausdrucksstärkere, präzisere Darstellung basierend auf dem bereitgestellten Text.

Das neue System baut auf ChatGPT auf und ermöglicht eine nahtlose Interaktion zwischen den Text- und Bildplattformen.

Benutzer können ChatGPT als „Brainstorming-Partner“ engagieren, um ihre Bildideen zu verfeinern. Wenn einem Benutzer ein generiertes Bild gefällt, er aber kleinere Änderungen wünscht, kann ein Gespräch mit ChatGPT diese Änderungen mit ein oder zwei Sätzen bewirken.

DALL·E 3 Sicherheitsmechanismen

Ein zusätzlicher Fokus auf Sicherheitsmechanismen zeichnet DALL·E 3 ebenfalls aus. Dazu gehören Abhilfemaßnahmen, um die Generierung von gewalttätigen, nicht jugendfreien oder hasserfüllten Inhalten zu verhindern.

Siehe auch  Die FluidMemory-Plattform verwendet ChatGPT zum Aufnehmen und Analysieren von Informationen – GrepBeat

Darüber hinaus lehnt DALL·E 3 die Generierung von Bildern ab, die lebende Persönlichkeiten des öffentlichen Lebens zeigen oder den Stil lebender Künstler imitieren.

Diese Vorsichtsmaßnahmen wurden in Zusammenarbeit mit Fachexperten entwickelt, die als „Red Teamer“ bekannt sind und das System gründlich auf Sicherheitslücken testen.

Entwickler suchen auch nach Möglichkeiten, Benutzern bei der Identifizierung von KI-generierten Bildern zu helfen. Sie forschen an einem „Provenienzklassifikator“, einem internen Tool, das erkennen kann, ob eine Idee von DALL·E 3 stammt.

Dieses Tool befindet sich in der experimentellen Phase, seine Entwicklung weist jedoch auf einen proaktiven Ansatz zur Behebung von Fehlinformationen und Bildmanipulationsproblemen hin.

Wann wird DALL·E 3 verfügbar sein?

DALL·E 3 soll im Oktober für ChatGPT Plus- und Enterprise-Kunden verfügbar sein.

OpenAI plant, eine großzügige Lizenzierung anzubieten, die es ChatGPT-Benutzern ermöglicht, die von ihnen erstellten Bilder frei zu verwenden, zu verkaufen oder zu vermarkten, ohne dass eine Genehmigung der Plattform erforderlich ist.

Microsoft plant außerdem, in den kommenden Wochen DALL·E 3-Unterstützung zu Bings AI Image Creator und Designer hinzuzufügen.

Wie Künstler und Content-Ersteller sich von der DALL·E 3-Schulung abmelden können

Wie alle KI-Modelle erlernt DALL·E 3 seine Fähigkeiten aus einer breiten Palette öffentlicher Daten, einschließlich Text und Bildern. Dieser Lernprozess spiegelt die Art und Weise wider, wie Menschen Wissen erwerben.

Beispielsweise kann die KI nach der Untersuchung verschiedener Bilder von Katzen ein völlig neues, einzigartiges Bild einer Katze erzeugen – ähnlich wie eine Person eine Katze zeichnen würde, nachdem sie genügend Beispiele gesehen hat.

Siehe auch  ChatGPT treibt den Anstieg der KI-Investitionen voran

Es ist wichtig zu beachten, dass diese Modelle, sobald sie ihre Trainingsdaten assimiliert haben, keinen direkten Zugriff mehr darauf haben. Wenn ein Benutzer mit dem Modell interagiert, greift es auf dessen verinnerlichte Konzepte zurück und nicht auf eine externe Datenbank.

OpenAI hat Künstlern zwei Möglichkeiten geboten, sich von der KI-Schulung abzumelden, um ethischen Überlegungen zum Eigentum an Inhalten Rechnung zu tragen.

Websitebesitzer können den Zugriff des GPTBot, eines Webcrawlers zum Sammeln von Trainingsdaten, auf ihre Website blockieren. Das Hinzufügen von GPTBot zu den robots.txt-Protokollen der Website kann für Benutzer mit großen Bildmengen eine effizientere Lösung sein.

Alternativ stellte OpenAI a bilden damit Einzelpersonen die Entfernung ihrer Inhalte aus zukünftigen Trainingsdatensätzen beantragen können.

Es ist erwähnenswert, dass OpenAI auch Lizenzen für Datensätze erwirbt. Wenn Sie also die Lizenzierung durch Dritte auf anderen Plattformen zugelassen haben, ist durch das Ausfüllen des Formulars möglicherweise keine vollständige Entfernung gewährleistet.

Die Zukunft der Content-Erstellung mit generativer KI

Das aktualisieren zur KI-Bildgenerierung von OpenAI stellt einen weiteren bedeutenden Fortschritt für Vermarkter und Content-Ersteller dar.

Während es Grafikdesign für mehr Menschen zugänglich machen wird, öffnen Fortschritte in diesem Bereich die Tür zu komplexeren rechtlichen und ethischen Fragen.


Ausgewähltes Bild: Vladimka-Produktion/Shutterstock

5/5 - (488 votes)
Anzeige
Nina Weber
Nina Weber is a renowned Journalist, who worked for many German Newspaper's Tech coloumns like Die Zukunft, Handelsblatt. She is a contributing Journalist for futuriq.de. She works as a editor also as a fact checker for futuriq.de. Her Bachelor degree in Humanties with Major in Digital Anthropology gave her a solid background for journalism. Know more about her here.

Kommentieren Sie den Artikel

Bitte geben Sie Ihren Kommentar ein!
Bitte geben Sie hier Ihren Namen ein