„Das ist hier unsere Herausforderung“, sagte Peter Deng, Vizepräsident für Verbraucherprodukte bei OpenAI, in einem Interview. „Eine der schwierigsten Aufgaben besteht darin, diese erstaunliche Technologie in die Einfachheit zu übersetzen, nach der die nächsten 300 bis 400 Millionen Menschen suchen.“
Die Ankündigung von OpenAI macht deutlich, wie Amazon, einer der führenden Anbieter von Sprachassistenten mit Alexa, in den letzten Monaten bei der Einführung neuer KI-Tools für die breite Öffentlichkeit hinter der Kurve zurückgeblieben ist. Am Montag, am selben Tag wie die Ankündigung von OpenAI, gab Amazon bekannt, dass es einen Vertrag unterzeichnet habe Investieren Sie bis zu 4 Milliarden US-Dollar in einem anderen KI-Start-up, Anthropic. Der Deal ist der größte im KI-Bereich seit Microsoft Anfang des Jahres seine bahnbrechende Investition in OpenAI unterzeichnet hat und spiegelt wider, wie Technologiegiganten auf angesagte KI-Start-ups setzen. Die Investition von Microsoft in OpenAI, die zu zahlreichen Produktpartnerschaften geführt hat, hat dazu beigetragen, dass das Unternehmen im KI-Wettbewerb einen rasanten Vorsprung hat.
Die Entwicklungen folgen auf mehrere KI-Starts von Unternehmen wie Google, Amazon und OpenAI in der vergangenen Woche, ein rasantes Tempo, das den Ansturm zeigt, die Konkurrenz zu schlagen. Die Unternehmen probieren verschiedene Ansätze aus, um Menschen dazu zu bringen, die Bots zu nutzen und dafür zu bezahlen. Der Einbau in vorhandene Lautsprecher ist einer der wichtigsten Wege, die sie erkunden. Letzte Woche gab Amazon bekannt, dass es seinen Alexa-Heimlautsprechern, die in Millionen von Haushalten installiert sind, eine Chatbot-„Konversations“-Funktion hinzufügen wird. Im Laufe des Sommers teilte Google seinen Mitarbeitern mit, dass es erwäge, die Technologie hinter seinem Bard-Chatbot in seine eigenen Sprachassistenten zu integrieren.
Bisher konnten Menschen ChatGPT-Fragen stellen, indem sie sie in der mobilen App laut aussprechen, der Bot antwortete jedoch mit Text.OpenAI sagte auch, dass die Leute jetzt Bilder als Teil ihrer Fragen an den Bot hochladen können, etwa ein Foto der Zutaten in einem Kühlschrank zeigen und ChatGPT bitten, Rezeptvorschläge zu machen. Durch das Hinzufügen von Sprach- und Bildfunktionen wird ChatGPT auch einen weiteren Schritt hin zu einem echten „multimodalen“ Modell machen – einem Chatbot, der die Welt „sehen“ und „hören“ kann und mit Sprache und Bildern reagiert und zusätzlich nur mit Text gefüttert wird Aufforderungen. KI-Forscher und -Analysten sagen, dass multimodale Modelle die nächste Stufe des Wettbewerbs in der Branche darstellen und Unternehmen darum kämpfen, das leistungsfähigste Modell zu entwickeln.
Sprachassistenten gibt es schon seit Jahren in Autos, Smartphones, Fernsehern und Heimlautsprechern und Millionen von Menschen nutzen sie täglich. Meistens beschränkt sich ihre Verwendung jedoch auf eine kleine Reihe routinemäßiger Interaktionen, beispielsweise auf die Aufforderung, das Licht auszuschalten oder einen Wetterbericht zu übermitteln. Die „große Sprachmodell“-Technologie hinter Chatbots eröffnet die Möglichkeit, dass Sprachassistenten viel besser in der Lage sein könnten, längere, natürliche Gespräche zu führen und komplexere Fragen zu beantworten.
Investoren und Analysten warfen Amazon vor, träge auf die Konkurrenz um „generative“ KI wie Chatbots und Bildgeneratoren zu reagieren, und der Anthropic-Deal wird dem Unternehmen Zugang zu den Forschern und der Technologie des Start-ups verschaffen. Anthropic wurde von ehemaligen OpenAI-Mitarbeitern gegründet und hatte zuvor Investitionen von Google übernommen.
„Diese Ankündigung ist ein weiterer Weg, mit dem Amazon dem Markt zeigt, dass sie ein legitimer Akteur im GenAI-Bereich sind und die Wahrnehmung überwinden, dass sie dahinter stehen“, sagte Jim Hare, Vizepräsident des Technologieforschungsunternehmens Gartner.
(Amazon-Gründer Jeff Bezos ist Eigentümer der Washington Post, und Patty Stonesifer, Interims-CEO der Post, sitzt im Vorstand von Amazon.)
OpenAI löste im November den Chatbot-Boom aus, als es ChatGPT öffentlich machte. Seitdem haben sich die Technologiegiganten bemüht, ihre eigenen zu entwickeln, wobei Microsoft mit OpenAI eine Partnerschaft eingegangen ist, um seine Technologie zu nutzen, und Google seinen Bard-Chatbot herausgebracht hat.
KI-Forscher haben gewarnt, dass Menschen dazu neigen, Chatbots zu vermenschlichen, insbesondere da ihre Antworten normalerweise menschenähnlich erscheinen. Dies könnte den Benutzern ein falsches Vertrauen in die Intelligenz oder Fähigkeiten des Bots vermitteln. Alle Chatbots erfinden immer noch routinemäßig Informationen und geben sie als real aus, ein Problem, das KI-Forscher als „Halluzination“ bezeichnen.
Die neuen Personas für ChatGPT heißen Sky, Ember, Breeze, Juniper und Cove. Jede der Personas hat einen anderen Ton und Akzent. „Sky“ klingt ein wenig nach Scarlett Johansson, der Schauspielerin, die die KI geäußert hat, in die sich Joaquin Phoenix‘ Figur im Film „Her“ verliebt. Deng, der OpenAI-Manager, sagte, dass die Voice-Personas nicht wie eine bestimmte Person klingen sollten.
In einer Demo zeigte er, wie der Bot weitschweifige und offene Sprachfragen verstehen kann. Anstatt darüber nachdenken zu müssen, wie man eine Frage genau formuliert, machen die neuen Funktionen Gespräche einfacher und fließender, sagte er.
„Mit dieser Funktion können Sie einfach reden“, sagte Deng. „Meine Kinder fordern jetzt Gute-Nacht-Geschichten von ChatGPT an.“
OpenAI testete die Sprach- und Bildfunktionen und fügte Leitplanken hinzu, um sicherzustellen, dass der Bot angemessen auf sensible Themen reagiert, indem er beispielsweise dem Benutzer empfiehlt, einen Fachmann zu konsultieren, wenn er Fragen zur psychischen Gesundheit stellt, sagte Sandhini Agarwal, Politikforscherin bei OpenAI, in einem Interview . Es werde aber noch mehr zu tun geben, sagte sie. „Die Arbeit endet nicht morgen.“