OpenAI heute gestartet eine neue Version des DALL-E-Editors, des Bildgenerators mit künstlicher Intelligenz, der in den kostenpflichtigen Stufen von chatgpt enthalten ist.

Die Funktion basiert auf einem KI-Modell namens DALL-E 3, das das Unternehmen im vergangenen September vorgestellt hat. Ein paar Wochen später OpenAI integriert das Modell in ChatGPT. Die Originalversion des DALL-E-Editors, die letztes Jahr auf den Markt kam, ermöglichte es Kunden, Bilder auf der Grundlage von Textaufforderungen und visuellen Beispielen zu erstellen und nachträgliche Bearbeitungen vorzunehmen.

Das heutige Update erleichtert Benutzern die Bearbeitung der von ihnen generierten Bilder.

Innerhalb von ChatGPT-3 ist der DALL-E-Editor über dieselbe Chatbot-Schnittstelle zugänglich wie die anderen Funktionen des Dienstes. Eine neu hinzugefügte Schaltfläche „Auswählen“ oben auf der Benutzeroberfläche ermöglicht es Benutzern, den spezifischen Bildabschnitt hervorzuheben, den sie bearbeiten möchten. Von dort aus können sie Anweisungen in natürlicher Sprache eingeben, die die Änderungen beschreiben, die sie vornehmen möchten.

Ein Benutzer könnte beispielsweise in einem Foto eines Waldes einen Kreis um einen Baum zeichnen und ihn vom DALL-E-Editor entfernen lassen. Es ist auch möglich, das Design der Objekte in einem Bild zu ändern oder neue hinzuzufügen. „Wir empfehlen, einen großen Raum um den Bereich herum auszuwählen, den Sie bearbeiten möchten, um bessere Ergebnisse zu erzielen“, erklärte OpenAI in einem Wissensdatenbankartikel, in dem das Update detailliert beschrieben wird.

Siehe auch  Die dunkle Kunst von ChatGPT und Wählereinfluss

Zu diesem Anlass haben die Ingenieure des Unternehmens auch eine Reihe von Usability-Features hinzugefügt. Im DALL-E-Editor ermöglichen die neuen Schaltflächen „Rückgängig“ und „Wiederherstellen“, schnell die Auswahl von Bildabschnitten aufzuheben, die der Benutzer mit dem Auswahlwerkzeug markiert hat. Kunden können außerdem das Seitenverhältnis des vom Tool generierten Bildes anpassen und auf Vorschläge für den Zeichenstil zugreifen.

Der DALL-E-Editor ist in ChatGPT Pro verfügbar, einer kostenpflichtigen Version des Chatbots für Verbraucher, sowie in zwei erweiterten Produktstufen, die OpenAI für Organisationen anbietet. Die Funktion ist sowohl in der Web- als auch in der Mobilversion verfügbar.

DALL-E 3, der KI-Bildgenerator, auf dem die Funktion basiert, ist die dritte Iteration eines neuronalen Netzwerks, das OpenAI erstmals im Jahr 2021 vorstellte. Es generiert Bilder in höherer Qualität als die Vorgängerversionen. Es kann auch Benutzeranweisungen genauer befolgen, eine Funktion, die OpenAI dem Trainingsdatensatz von DALL-E 3 zuschreibt.

Die Forscher des Unternehmens trainierten die KI anhand einer großen Sammlung von Bildern und entsprechenden Bildunterschriften. Laut OpenAI wurden 95 % dieser Untertitel mithilfe eines benutzerdefinierten Sprachmodells erstellt entwickelt speziell für DALL-E 3. Dieses Sprachmodell generiert relativ kurze Bildbeschreibungen, die nur die Kernelemente eines Bildes detailliert beschreiben. OpenAI hat festgestellt, dass dieser Ansatz dem KI-Training förderlich ist.

DALL-E 3 ist eines von mehreren Modellen, die das Unternehmen für Multimedia-Generierungsaufgaben entwickelt hat. Zu den weiteren Einträgen in dieser Kategorie gehören: Sprachmaschineein KI-System, das synthetische Sprache erzeugen kann, und das Sora Text-zu-Video-Modell. DALL-E 3 ist das einzige der drei, das OpenAI allgemein verfügbar gemacht hat.

Bild: OpenAI

Ihre Unterstützung ist uns wichtig und hilft uns, den Inhalt KOSTENLOS zu halten.

Ein Klick unten unterstützt unsere Mission, kostenlose, umfassende und relevante Inhalte bereitzustellen.

Treten Sie unserer Community auf YouTube bei

Treten Sie der Community bei, die mehr als 15.000 #CubeAlumni-Experten umfasst, darunter Andy Jassy, ​​CEO von Amazon.com, Michael Dell, Gründer und CEO von Dell Technologies, Pat Gelsinger, CEO von Intel, und viele weitere Koryphäen und Experten.

„TheCUBE ist ein wichtiger Partner der Branche. Ihr seid wirklich ein Teil unserer Veranstaltungen und wir wissen es wirklich zu schätzen, dass ihr kommt, und ich weiß, dass die Leute auch die von euch erstellten Inhalte schätzen“ – Andy Jassy

DANKE

Siehe auch  Ragans #5-Geschichte von '23: Wie wird sich ChatGPT auf den Kommunikationsberuf auswirken?
Anzeige

Kommentieren Sie den Artikel

Bitte geben Sie Ihren Kommentar ein!
Bitte geben Sie hier Ihren Namen ein