Gesponserte Inhalte
Wenn Sie mit Technologie und KI auf dem Laufenden bleiben, wissen Sie, dass es bei der Generierung von Bildern midjourney.com/home/?callbackUrl=%2Fapp%2F“ rel=“noopener“ target=“_blank“>Mitten auf der Reise war jedermanns Pay-to-Play-Anlaufstelle. Jetzt sieht es so aus, als hätten sie Konkurrenz. Die generative KI macht ihr Rennen, mit OpenAI freigeben VON UND 3 ein Bildgenerator am 20. September 2023.
Haben Sie schon einmal einen tollen Blog geschrieben und wollten ein Bild, das dazu passt? Hatten Sie schon einmal eine wirklich coole Idee und wollten sie in einer visuellen Darstellung sehen? Waren Sie schon einmal zu müde, um ein eigenes Bild zu erstellen, und wollten es sofort? Und obendrein wollten Sie, dass es genau das ist, was Sie sich vorgestellt haben. Nun, all das können Sie mit DALL·E 3 tun.
Fangen wir von vorne an. DALL·E ist ein Text-zu-Bild-Modell, das von OpenAI mithilfe von Deep-Learning-Methoden entwickelt wird. Wir haben gesehen, dass DALL·E 2 digitale Bilder mithilfe der Verarbeitung natürlicher Sprache erzeugen kann, und jetzt haben wir DALL·E 3.
DALL·E 3 ist größer und besser geworden und hat die Möglichkeit, alle Ecken und Kanten zu verstehen, mehr Nuancen und Details als je zuvor. Mithilfe von „Eingabeaufforderungen“ können Sie Ihre Ideen jetzt ganz einfach in präzise digitale Bilder umsetzen.
Was ist also der Unterschied zwischen den beiden? Wie ist DALL·E 3 besser?
Versteht den Kontext viel besser
Der Hauptunterschied zwischen DALL·E 2 und DALL·E 3 besteht im Kontextverständnis des Modells. DALL·E 2 hatte leider Schwierigkeiten, den Kontext vollständig zu verstehen, selbst wenn er ausdrücklich dazu aufgefordert wurde, da er bestimmte Wörter ignorierte. DALL·E 3 versteht den Kontext viel besser und liefert Benutzern das gewünschte Bild.
Hand in Hand mit ChatGPT
DALL·E 3 wurde speziell auf ChatGPT entwickelt. Dadurch können Sie DALL·E 3 und ChatGPT Hand in Hand nutzen, um Ihre Ideen zu sammeln und Ihre Eingabeaufforderungen besser zu verfeinern. Wenn DALL·E 3 mit einer Idee aufgefordert wird, generiert ChatGPT einzigartige, maßgeschneiderte und detaillierte Vorschläge, die DALL·E 3 zum Leben erwecken kann.
Wenn DALL·E 3 ein Bild erzeugt, das Ihnen nicht gefällt, können Sie ChatGPT bitten, weitere Optimierungen vorzunehmen, um das gewünschte Bild zu erhalten.
Die Bilder gehören Ihnen!
Bilder, die von DALL·E 2 erstellt wurden, gehörten nicht dem Benutzer, der sie erstellt hat. Mit DALL·E 3 gehören die Bilder, die Sie erstellen, ganz Ihnen! Das bedeutet, dass Sie keine Genehmigung von OpenAI benötigen, um sie nachzudrucken, zu verkaufen oder zu vermarkten. Auf jeden Fall eine interessante Entwicklung.
Nachahmung lebender Künstler
Wir gehen nicht auf die Frage ein, warum es ein Problem ist, lebende Künstler nachzuahmen – wir wissen, dass man sehr schnell hässlich werden kann. Klagen, Urheberrechtsverletzungen, Sie verstehen, was ich hier sagen möchte.
Ein Vertreter von OpenAI sagte, dass DALL·E 3 speziell darauf trainiert wurde, die Erzeugung von Bildern zu verhindern, die den Stil lebender Künstler nachahmen. Dagegen kann DALL·E 2 derzeit dazu veranlasst werden, den Kunststil bestimmter Künstler nachzuahmen. Um sicherzustellen, dass Künstler zufrieden sind, hat OpenAI dies auch getan ein Formular zur Verfügung gestellt bei dem Entwickler die Verwendung ihrer Bilder zum Trainieren zukünftiger Modelle ablehnen können.
Gefälschte Bilderzeugung
Nach dem, was wir über DALL·E 3 erfahren haben, scheint es sich um einen offenen Spielplatz zu handeln. OpenAI achtet jedoch immer noch sehr streng auf die Sicherheit beim Einsatz aller seiner generativen KI-Tools. OpenAI hat erklärt, dass DALL·E 3 genau wie DALL·E 2 über einen implementierten Schlüsselwort- und Bilderkennungsfilter verfügt, der die Fähigkeit der Benutzer einschränkt, schädliche, gewalttätige und sexuelle Inhalte zu generieren. Wir haben dies bereits bei der Generierung von Midjourney gesehen gefälschte Bilder von der Verhaftung von Donald Trump.
Schauen Sie sich das Bild unten an, das den Unterschied zwischen DALL·E 2 und DALL·E 3 zeigt, und sehen Sie sich die Ausgabe bei der Generierung eines Bildes mit der Eingabeaufforderung „Ein ausdrucksstarkes Ölgemälde eines Basketballspielers beim Eintauchen, dargestellt als Explosion eines Nebels“ an.
DALL·E 3 wurde erst kürzlich für ChatGPT Pro eingeführt und wird in Kürze für OpenAI-APIs verfügbar sein Labore sowie.
Um DALL·E 3 von ChatGPT Pro zu nutzen und bequem über die vertraute Chat-Oberfläche mit dem Dienst zu interagieren, gehen Sie einfach zur ChatGPT-Website und wählen Sie in der Menüoption ChatGPT-4 „DALL·E 3 (Beta)“ aus.
An diesem Punkt müssen Sie nur noch auf die gleiche Weise mit ChatGPT interagieren, wie Sie es sonst tun würden.
Erstellen Sie ein Bild einer bergigen Winterszene mit einer Hütte und einigen Ziegen
Und hier ist, was DALL·E 3 direkt in der ChatGPT-Schnittstelle generiert und ausgibt:
So einfach ist das. ChatGPT kümmert sich um die Entwicklung nützlicher Eingabeaufforderungen, die DALL·E verwenden kann, wodurch das System weitaus zugänglicher ist als einige der anderen verfügbaren Optionen, die eine clevere Eingabeaufforderungsentwicklung erfordern, um die besten Ergebnisse zu erzielen.
Und das ist DALL·E 3, wie es im Moment ist. Was bedeutet das für andere Wettbewerber im Bereich KI-Bildgeneratoren, z Mitten auf der Reise Und StabilitätKI?
Teilen Sie uns Ihre Meinung in den Kommentaren unten mit.
Nisha Arya ist Datenwissenschaftler und freiberuflicher technischer Redakteur. Ihr besonderes Interesse gilt der Bereitstellung von Berufsberatung oder Tutorials sowie theoriebasiertem Wissen rund um Data Science im Bereich Data Science. Sie möchte auch die verschiedenen Möglichkeiten erforschen, wie künstliche Intelligenz der Langlebigkeit des menschlichen Lebens zugute kommt bzw. beitragen kann. Sie ist eine eifrige Lernerin, die ihr technisches Wissen und ihre Schreibfähigkeiten erweitern und gleichzeitig dabei helfen möchte, andere anzuleiten.