Sam Altman, CEO von OpenAI, sagt, dass die ersten Benutzer in den nächsten Wochen Zugriff auf GPT-4o Advanced Voice erhalten werden, es sich dabei jedoch um eine begrenzte „Alpha“-Einführung handeln wird.

Das Unternehmen testet die volle Leistungsfähigkeit von GPT-4o, einem neuen Omni-Modelltyp, der im Mai im Rahmen seines Spring Update veröffentlicht wurde. Im Gegensatz zu GPT-4 kann dieses nativ multimodale Modell Sprache direkt verstehen, ohne sie in Text umzuwandeln.

Dies macht GPT-4o in seiner Rolle als Sprachassistent sowohl schneller als auch deutlich präziser und ermöglicht es ihm sogar, während eines Gesprächs Tonfall und Stimmintonation zu erkennen.

Benutzer haben geduldig auf den Zugriff gewartet, aber OpenAI sagt, dass zuerst die Sicherheitstests abgeschlossen werden müssen. Einige haben kurzzeitig Zugriff erhalten und es gab mehrere Demos der Funktionen, aber die meisten Benutzer werden ihn erst später in diesem Jahr erhalten.

Was ist GPT4o Advanced Voice

GPT-4o Advanced Voice ist ein völlig neuer Typ von Sprachassistent, ähnlich, aber größer als das kürzlich vorgestellte französische Modell Moshi, das mit mir über eine Geschichte stritt.

In Demos des Modells haben wir gesehen, wie GPT-4o Advanced Voice benutzerdefinierte Charakterstimmen erstellt, beim Erzählen einer Geschichte Soundeffekte generiert und sogar als Live-Übersetzer fungiert.

Diese native Sprachfähigkeit ist ein wichtiger Schritt zur Entwicklung natürlicherer KI-Assistenten. In Zukunft wird es auch Live-Vision-Fähigkeiten geben, sodass die KI sehen kann, was Sie sehen.

Zu den weiteren Anwendungsfällen für Advance Voice gehört, dass es als sehr geduldiger Sprachlehrer fungiert, Ihre Aussprache direkt korrigiert und Ihnen hilft, Ihren Akzent zu verbessern.

„Der erweiterte Sprachmodus von chatgpt kann Emotionen und nonverbale Signale verstehen und darauf reagieren, was uns Echtzeit-Gesprächen mit künstlicher Intelligenz näher bringt. Unsere Mission ist es, Ihnen diese neuen Erfahrungen mit Bedacht zu ermöglichen“, sagte OpenAI letzten Monat in einer Erklärung.

Warum gibt es eine Verzögerung bei der Einführung von GPT-4o Advanced Voice?

Charakterstimmen mit GPT-4o-Stimme – YouTube

Schau weiter

OpenAI ist eines der vorsichtigsten Labore für künstliche Intelligenz und nimmt sich viel Zeit für Sicherheitstests, Überprüfungen und die Einführung von Schutzmaßnahmen für jedes neue Hauptmodell.

Altman forderte auch eine Regulierung von Pioniermodellen wie dem kommenden GPT-5 oder Weltmodellen wie Sora aufgrund des Risikos, das sie für die Gesellschaft darstellen. Diese Vorsicht hat es anderen Unternehmen ermöglicht, mit OpenAI gleichzuziehen, und GPT-4 ist nicht mehr das einzige Spitzenmodell.

Das Unternehmen war besorgt, dass GPT-4o Advanced Voice ohne entsprechende Schutzmaßnahmen potenziell schädliche Informationen liefern oder unerwartet verwendet werden könnte. Um dies zu verhindern, wird die Software zunächst schrittweise für vertrauenswürdige Benutzer freigegeben und dann im Laufe der Zeit für eine breitere Öffentlichkeit zugänglich gemacht.

„Im Rahmen unserer iterativen Bereitstellungsstrategie werden wir die Alpha-Version mit einer kleinen Gruppe von Benutzern starten, um Feedback zu sammeln und sie auf Grundlage unserer Erkenntnisse zu erweitern“, erklärte ein Sprecher.

„Wir planen, dass alle Plus-Benutzer im Herbst Zugriff haben. Genaue Zeitpläne hängen davon ab, ob wir unsere hohen Sicherheits- und Zuverlässigkeitsstandards einhalten. Wir arbeiten auch daran, die neuen Video- und Bildschirmfreigabefunktionen einzuführen, die wir separat vorgeführt haben, und werden Sie über diesen Zeitplan auf dem Laufenden halten.“

Siehe auch  Von abgedroschenen Witzen bis hin zu Bewerbungen: Der neue Shop von ChatGPT verkauft spezielle KI-Software

Mehr von Tom's Guide

apple MacBook Air M3 (2024),Asus Zenbook S 13 OLED,Lenovo Chromebook Duet 3,Framework Laptop,Asus ROG Zephyrus G14 2023,Apple MacBook Pro 14-inch M3 (2023)“ data-widget-type=“comparison“ data-render-type=“editorial“>
Pfeil

Zurück zum MacBook Air

Pfeil

Weitere Angebote laden

5/5 - (470 votes)
Anzeige
Nina Weber
Nina Weber is a renowned Journalist, who worked for many German Newspaper's Tech coloumns like Die Zukunft, Handelsblatt. She is a contributing Journalist for futuriq.de. She works as a editor also as a fact checker for futuriq.de. Her Bachelor degree in Humanties with Major in Digital Anthropology gave her a solid background for journalism. Know more about her here.

Kommentieren Sie den Artikel

Bitte geben Sie Ihren Kommentar ein!
Bitte geben Sie hier Ihren Namen ein