OpenAI könnte apple, Amazon und google für seinen nächsten großen Vorstoß im Bereich der künstlichen Intelligenz im Visier haben und mit einem neuen Voice Engine-Tool den Markt für Sprachassistenten erobern.

Während chatgpt auf Mobilgeräten über eine sprachfreundliche Benutzeroberfläche verfügt – und kürzlich eine Möglichkeit eingeführt hat, seine Antworten auf dem Desktop vorlesen zu lassen – a neue Markenanmeldung von OpenAI für die Worte Voice Engine bezieht sich speziell auf den Aufbau digitaler Sprachassistenten.

Es ist jetzt möglich, den Standard-Sprachassistenten auf Android auszutauschen. Apple scheint mit einer Reihe von KI-Unternehmen über die Zukunft der künstlichen Intelligenz auf dem iphone zu verhandeln, daher könnte dies ein präventiver Schritt für OpenAI sein, einen potenziellen neuen Markt zu erschließen.

Gerüchten zufolge wird Apple mit dem nächsten großen Upgrade auf iOS auch einen eigenen AI App Store eröffnen, der einen neuen Markt für KI-gestützte Assistenten schaffen würde.

Sam Altman, CEO von OpenAI, sagte, dass dieses Jahr „viele verschiedene Dinge“ veröffentlicht werden. Es wird zwar erwartet, dass dies Sora umfassen wird, das KI-Videotool könnte aber auch ein neues KI-Sprachsystem umfassen.

Was wissen wir über Voice Engine?

(Bildnachweis: Getty)

Wir wissen nicht viel über Voice Engine oder ob es überhaupt ein Produkt sein wird. OpenAI hat sich nicht öffentlich dazu geäußert, daher haben wir nur Gerüchte und die Markenanmeldung.

Während es sich bei der Voice Engine um ein neues Modell handeln könnte, das speziell für Sprachanwendungen entwickelt wurde, ist es wahrscheinlich, dass es sich dabei auch um einen Teil eines Unternehmensprojekts für OpenAI handelt. Es könnte sich um den Aufbau eines hochwertigen Sprachsystems handeln, das es Unternehmen ermöglichen würde, effizientere Callcenter-Bots zu entwickeln.

Es hört sich nach all den Teilen an, die Sie für einen voll funktionsfähigen, vollständig interaktiven KI-Sprachassistenten benötigen, der nicht nur komplexe Aufgaben bewältigen kann, sondern auch ganz natürlich chatten und sogar Telefonanrufe in Ihrem Namen entgegennehmen kann.

Die neue Markenanmeldung wurde letzte Woche beim US-Patent- und Markenamt eingereicht. Auch wenn eine Anwendung nicht unbedingt bedeutet, dass daraus ein Produkt resultiert, so steht dies doch im Einklang mit der Verlagerung des breiteren Marktes mehr auf Sprache und der Ausrichtung von OpenAI auf zielgerichtete Modelle.

Die Einreichung umfasst die Erstellung von Software zum Aufbau digitaler Sprachassistenten, die Audiogenerierung aus Textansagen, die Verarbeitung von Sprachbefehlen und die Bereitstellung von Sprachdiensten.

Die vollständige Anwendung umfasst die Entwicklung der Bereitstellung von Sprachdiensten unter Verwendung von KI für Text oder Sprache und Text-zu-Audio, natürliche Sprache und Sprachverarbeitung, die Generierung von Audio und Sprache aus einer Eingabeaufforderung (Text, Sprache, Bild, Bild) und die Verarbeitung Sprachbefehle, Spracherkennung und Aufbau digitaler Sprachassistenten.

Das klingt nach all den Teilen, die Sie für einen voll funktionsfähigen, vollständig interaktiven KI-Sprachassistenten benötigen, der komplexe Aufgaben erledigen, natürlich chatten und sogar Telefonanrufe in Ihrem Namen entgegennehmen kann.

Wo passt GPT-5 hier hinein?

Chatgpt Voice Ist Kostenlos

(Bildnachweis: OpenAI)

OpenAI hat GPT-4 vor einem Jahr veröffentlicht. Damals handelte es sich um ein bahnbrechendes generatives KI-Modell, das ChatGPT und Microsoft Copilot unterstützt.

Das Unternehmen begann Ende letzten Jahres auch mit dem Training von GPT-5, was zu Spekulationen über das Veröffentlichungsdatum führte. Altman erzählte Podcaster Lex Fridman„Wir werden dieses Jahr ein fantastisches neues Modell herausbringen“, wollte aber nicht bestätigen, ob es sich dabei um GPT-5 oder einen Vorläufer handelte.

Siehe auch  ANEFL-Schulung 2023 „Intelligenter und kreativer Einsatz von ChatGPT zum Lehren und Lernen“. |

Er sagte auch, dass in den kommenden Monaten „viele verschiedene Dinge“ veröffentlicht würden. Laut OpenAI-CTO Mira Murati wird dazu auch die KI-Videoplattform Sora gehören.

In den sozialen Medien gibt es einige Spekulationen darüber, dass Sora und diese neue Voice Engine unterschiedliche modale Schnittstellen für GPT-5 sind.

Es ist sehr wahrscheinlich, dass GPT-5 ein echtes multimodales Modell sein wird, das Videos, Bilder, Sprache, Text und Code verstehen und alle diese Inhaltstypen generieren kann.

Voice Engine könnte ein neuer Assistent sein

Angesichts der Beschreibung der Marke ist es auch möglich, dass Voice Engine ein neuer Sprachassistent sein könnte, der die umfassenderen Fähigkeiten von Siri, Alexa oder Google Assistant mit den Argumentations- und natürlichen Sprachfähigkeiten von ChatGPT verbindet.

Google hat bereits damit begonnen, Gemini auf diese Weise zu aktualisieren, Apple soll angeblich eine neue Version von Siri mit umfangreichen Sprachmodellfunktionen entwickeln und Amazon testet bereits Alexa Plus mit ähnlichen zugrunde liegenden Fähigkeiten.

OpenAI bietet möglicherweise in Zukunft Voice Engine zur Stromversorgung solcher Systeme oder als alternative Schnittstelle zu ChatGPT an, die auf intelligenten Lautsprechern, Telefonen oder sogar Kopfhörern ausgeführt werden kann.

Oder es könnte einfach daran liegen, dass OpenAI mit Marken vorsichtig ist. Da ein Antrag auf Schutz von GPT abgelehnt wurde, hat das Unternehmen nun Markenanmeldungen für GPT-5, 6 und sogar GPT-7 eingereicht. Letzteres umfasst die Musikgenerierung, die Konvertierung von Text und Daten in Code sowie das Schreiben von Code von Grund auf.

Mehr von Tom's Guide

Anzeige
Nina Weber
Nina Weber is a renowned Journalist, who worked for many German Newspaper's Tech coloumns like Die Zukunft, Handelsblatt. She is a contributing Journalist for futuriq.de. She works as a editor also as a fact checker for futuriq.de. Her Bachelor degree in Humanties with Major in Digital Anthropology gave her a solid background for journalism. Know more about her here.

Kommentieren Sie den Artikel

Bitte geben Sie Ihren Kommentar ein!
Bitte geben Sie hier Ihren Namen ein