Leben
–>
OpenAI hat ChatGPT-4o (das „o“ steht für „omni“) enthüllt, das ein gesprächigeres Gefühl verspricht. Das Unternehmen beschrieb GPT-4o als „einen Schritt hin zu einer viel natürlicheren Mensch-Computer-Interaktion“. Das Tool verfügt über viele neue Features und kommuniziert zudem deutlich natürlicher und mit Emotionen.
Da GPT-4o viel besser und viel schneller ist als die Vorgängermodelle von OpenAI, verfügt das Tool auch über einige bemerkenswerte neue Funktionen. Eine davon ist die Möglichkeit, Gespräche in Echtzeit zu übersetzen.
Bevor Benutzer ein Gespräch beginnen, können sie GPT-4o bitten, das Gespräch zu verlassen. Sie können dies beispielsweise tun, indem Sie sagen: „Übersetzen Sie alles vom Spanischen ins Englische und alles vom Englischen ins Spanische.“ Während der Ankündigung dieses Updates demonstrierte OpenAI-CTO Mira Murati sofort, wie das funktioniert. Dabei fiel ihm sofort auf, wie schnell und natürlich diese Übersetzung geschieht.
Neben einer spanischen Vorführung führte OpenAI auch eine italienisch-englische Vorführung online durch, die genauso gut funktionierte. Insgesamt ist das Tool in mehr als 50 Sprachen verfügbar.
Es ist unklar, wann diese Funktion für die breite Öffentlichkeit verfügbar sein wird. Es ist jedoch bereits jetzt klar, dass es die internationale Kommunikation revolutionieren wird. Schon lange wird vorhergesagt, dass KI in Zukunft Sprachbarrieren lösen wird.
Laut OpenAI ist GPT-4o hinsichtlich der Turbo-Leistung bei Texten in Englisch und Code deutlich besser, mit erheblichen Verbesserungen bei Texten in nicht-englischen Sprachen und gleichzeitig schneller und kostengünstiger in der API. GPT-4o ist besonders beim Seh- und Audioverständnis besser.
Der überarbeitete Sprachmodus GPT-4o nutzt ein Multimodellsystem, das in den Versionen 3.5 und 4 des neuen Modells Ende-zu-Ende für Text, Bild und Audio verwendet wird, was bedeutet, dass alle Ein- und Ausgaben von demselben neuronalen Netzwerk verarbeitet werden. Da GPT-4o unser erstes Modell ist, das alle diese Modalitäten kombiniert, kratzen wir noch an der Oberfläche der Erforschung der Möglichkeiten und Grenzen des Modells.
Vielleicht als Reaktion auf Bedenken hinsichtlich des schnellen Tempos der KI-Entwicklung betonte OpenAI, dass es plant, auf eine Weise voranzukommen, die die Genauigkeit bewahrt und ein sicheres Benutzererlebnis bietet.
„GPT-4o verfügt über eine modalitätsübergreifende integrierte Sicherheit durch Techniken wie das Filtern von Trainingsdaten und die Verfeinerung des Verhaltens des Modells nach dem Training.“ „Wir haben auch neue Sicherheitssysteme geschaffen, um Absicherungen für Sprachausgaben bereitzustellen“, schrieb das Unternehmen auf seiner Website.
„Wir haben GPT-4o gemäß unserem Preparedness Framework und im Einklang mit unseren freiwilligen Verpflichtungen bewertet. Unsere Auswertungen zu Cybersicherheit, CBRN, Überzeugungskraft und Modellautonomie zeigen, dass GPT-4o in keiner dieser Kategorien über dem mittleren Risiko liegt. Diese Bewertung umfasste die Durchführung einer Reihe automatisierter und menschlicher Bewertungen während des gesamten Modelltrainingsprozesses. Wir haben sowohl Versionen des Modells vor der Sicherheitsminderung als auch nach der Sicherheitsminderung getestet und dabei benutzerdefinierte Feinabstimmungen und Eingabeaufforderungen verwendet, um die Modellfähigkeiten besser zu ermitteln.“
GPT-4o ist im kostenlosen Kontingent und für Plus-Benutzer mit bis zu 5-mal höheren Nachrichtenlimits verfügbar. Eine neue Version des Sprachmodus mit GPT-4o in ChatGPT Plus wird in den kommenden Wochen veröffentlicht.
TechCentral-Reporter