SAN FRANCISCOchatgpt kann jetzt Bilder generieren – und sie sind erschreckend detailliert. Fügen Sie eine Anzeige hinzu

Am Mittwoch veröffentlichte OpenAI, das Startup für künstliche Intelligenz aus San Francisco, eine neue Version seines DALL-E-Bildgenerators für eine kleine Gruppe von Testern und integrierte die Technologie in ChatGPT, seinen beliebten Online-Chatbot.

Das DALL-E 3 genannte Gerät kann überzeugendere Bilder erzeugen als frühere Versionen der Technologie und zeigt ein besonderes Gespür für Bilder mit Buchstaben, Zahlen und menschlichen Händen, so das Unternehmen.

„Es ist weitaus besser darin, die Wünsche des Benutzers zu verstehen und darzustellen“, sagte Aditya Ramesh, ein OpenAI-Forscher, und fügte hinzu, dass die Technologie entwickelt wurde, um ein präziseres Verständnis der englischen Sprache zu ermöglichen.

Durch das Hinzufügen der neuesten Version von DALL-E zu ChatGPT festigt OpenAI seinen Chatbot als Hub für generative KI, der selbst Texte, Bilder, Töne, Software und andere digitale Medien produzieren kann. Seit ChatGPT letztes Jahr viral ging, hat es einen Wettlauf unter den Technologiegiganten des Silicon Valley darum begonnen, mit Fortschritten an der Spitze der KI zu stehen.

Am Dienstag veröffentlichte google eine neue Version seines Chatbots Bard, der eine Verbindung zu mehreren der beliebtesten Dienste des Unternehmens herstellt, darunter Gmail, YouTube und Docs. midjourney und Stable Diffusion, zwei weitere Bildgeneratoren, haben diesen Sommer ihre Modelle aktualisiert.

OpenAI bietet seit langem Möglichkeiten zur Verbindung seines Chatbots mit anderen Online-Diensten, darunter Expedia, OpenTable und Wikipedia. Doch es ist das erste Mal, dass das Startup einen Chatbot mit einem Bildgenerator kombiniert.

Sandhini Agarwal, ein OpenAI-Forscher, der sich auf Sicherheit und Richtlinien konzentriert, am 10. März 2023 am Hauptsitz des Unternehmens in San Francisco.

DALL-E und ChatGPT waren bisher separate Anwendungen. Aber mit der neuesten Version können Benutzer nun den Dienst von ChatGPT nutzen, um digitale Bilder zu erstellen, indem sie einfach beschreiben, was sie sehen möchten. Oder sie können Bilder anhand der vom Chatbot generierten Beschreibungen erstellen und so die Generierung von Grafiken, Kunstwerken und anderen Medien weiter automatisieren.

Siehe auch  Ein neuer anonymer Messenger mit integriertem ChatGPT erfreut sich im Netzwerk zunehmender Beliebtheit

In einer Demonstration diese Woche zeigte Gabriel Goh, ein OpenAI-Forscher, wie ChatGPT jetzt detaillierte Textbeschreibungen generieren kann, die dann zur Erstellung von Bildern verwendet werden. Nachdem der Bot beispielsweise Beschreibungen eines Logos für ein Restaurant namens Mountain Ramen erstellt hatte, generierte er innerhalb von Sekunden mehrere Bilder aus diesen Beschreibungen.

Die neue Version von DALL-E kann Bilder aus Beschreibungen mit mehreren Absätzen erstellen und den bis ins kleinste Detail dargelegten Anweisungen genau folgen, sagte Goh. Wie alle Bildgeneratoren – und andere KI-Systeme – sei es auch fehleranfällig, sagte er.

Da OpenAI an der Verfeinerung der Technologie arbeitet, wird es DALL-E 3 erst im nächsten Monat der breiten Öffentlichkeit zugänglich machen. DALL-E 3 wird dann über ChatGPT Plus verfügbar sein, ein Dienst, der 20 US-Dollar pro Monat kostet.

Experten warnen, dass bildgenerierende Technologien dazu genutzt werden könnten, große Mengen an Desinformation online zu verbreiten. Um dem vorzubeugen, hat OpenAI mit DALL-E 3 Tools integriert, die problematische Themen wie sexuell eindeutige Bilder und Darstellungen von Persönlichkeiten des öffentlichen Lebens verhindern sollen. Das Unternehmen versucht außerdem, die Fähigkeit von DALL-E einzuschränken, den Stil bestimmter Künstler zu imitieren.

In den letzten Monaten wurde KI als Quelle visueller Fehlinformationen genutzt. Unter anderem eine synthetische und nicht besonders raffinierte Parodie einer scheinbaren Explosion im Pentagon ließ den Aktienmarkt im Mai kurzzeitig sinken. Wahlexperten befürchten außerdem, dass die Technologie bei großen Wahlen böswillig eingesetzt werden könnte.

Sandhini Agarwal, ein OpenAI-Forscher, der sich auf Sicherheit und Politik konzentriert, sagte, dass DALL-E 3 dazu neigte, Bilder zu erzeugen, die eher stilisiert als fotorealistisch waren. Dennoch räumte sie ein, dass das Modell dazu veranlasst werden könne, überzeugende Szenen zu produzieren, etwa die Art von körnigen Bildern, die von Überwachungskameras aufgenommen würden.

Siehe auch  Der ChatGPT-Hype befeuert Zuflüsse in KI-Fonds mit dem größten Auftrieb für in Europa ansässige Produkte

OpenAI plant größtenteils nicht, potenziell problematische Inhalte von DALL-E 3 zu blockieren. Agarwal sagte, ein solcher Ansatz sei „einfach zu weit gefasst“, da Bilder je nach Kontext, in dem sie erscheinen, harmlos oder gefährlich sein könnten.

„Es hängt wirklich davon ab, wo es verwendet wird und wie die Leute darüber sprechen“, sagte sie.

Lesen Sie mehr über Technologie Jordanische Nachrichten

Anzeige

Kommentieren Sie den Artikel

Bitte geben Sie Ihren Kommentar ein!
Bitte geben Sie hier Ihren Namen ein