[ad_1]
- OpenAI hat ein GPT-4o-Update für ChatGPT veröffentlicht, das über Audio, Bild und Text kommunizieren kann.
- Der verbesserte Chatbot verfügt über eine menschenähnliche Fähigkeit, Diktate nachzuahmen und dabei Humor und Stimmlage zu verleihen.
- Die erhöhten Fähigkeiten von GPT-4o setzen seine technischen Konkurrenten unter Druck, zu beweisen, dass sie aufholen können.
Sam Altman, CEO von OpenAI, neckte, dass sich das neue ChatGPT-Update „wie Magie anfühlt“ – und er hatte nicht unrecht.
Das KI-Unternehmen hat im Grunde eine Flagge in den Sand gepflanzt, die mit zwei Worten an seine Big-Tech-Rivalen gerichtet ist: Ihr Zug.
Mira Murati, CTO von OpenAI, stellte ChatGPT am Montag das „Frühlings-Update“ mit einer Reihe von Live-Demos vor. Die neueste Version des KI-Chatbots, der auf OpenAIs neuem Flaggschiff-KI-Modell GPT-4o basiert, kann in Echtzeit über Audio, Bild und Text nachdenken.
Und es ist überraschend menschlich.
Wir werden verrückt, kurz vor dem Film „Her“
Zunächst einmal haben die Sprach- und Konversationsfähigkeiten von ChatGPT dank GPT-4o einen großen Sprung nach vorne gemacht, da es nun in der Lage ist, Emotionen auszudrücken und seinen Ton zu variieren.
Die neue KI klang in der Demo wie die Stimme einer amerikanischen Frau – denken Sie an Scarlett Johansson in Spike Jonzes Film „Her“ –, obwohl OpenAI-Forscher sie irgendwann auf eine Roboterstimme umstellen ließen. Ein OpenAI-Sprecher sagte, die Audioausgabe werde beim Start auf eine Auswahl voreingestellter Stimmen beschränkt sein.
Die Stimme klang nicht nur menschlich. Es zeigte auch eine unheimliche Fähigkeit, menschliche Diktate nachzuahmen. Das neue ChatGPT kichert, fügt Humor hinzu und mildert die Stimmlage je nach Aufforderung.
Es scheint auch in der Lage zu sein, einige menschliche Signale zu erkennen. Als ein Forscher hyperventilierte, während er tiefes Atmen übte, sagte der Chatbot: „Mark, du bist kein Staubsauger.“
Sie können den Chatbot auch unterbrechen, wodurch sich Gespräche natürlicher anfühlen. Sie müssen nicht warten, bis die KI ihre Antwort beendet hat, bevor Sie eine klärende Frage stellen oder das Thema wechseln.
Auch die Reaktionszeit war blitzschnell. Ein OpenAI-Sprecher sagte, der Chatbot könne auf Audioeingaben mit einer ähnlichen Reaktionsgeschwindigkeit wie Menschen reagieren und durchschnittlich 320 Millisekunden dauern.
Im Anschluss an die Veranstaltung postete OpenAI-CEO Sam Altman auf X, ehemals Twitter, den Filmtitel, der vielen Menschen in den Sinn kam, nachdem sie die Demos gesehen hatten.
Auch die Augen von ChatGPT haben ein Upgrade erhalten
Der Chatbot verfügte über ausgeprägte Fähigkeiten zur Interpretation eines Diagramms, zur Unterstützung bei der Codierung, zur Interpretation von Emotionen und im Wesentlichen dazu, den Benutzern mathematische Gleichungen beizubringen, indem er sich Videos oder Bilder ansah, die auf der Kamera eines Telefons angezeigt wurden.
Die ganze Zeit über behielt der Sprachassistent einen unbeschwerten und fröhlichen Ton bei.
In einer separaten, online geteilten Demo war GPT-4o sogar in der Lage, Videos des Raums um einen Benutzer herum zu analysieren und dabei zu erkennen, dass die Person einen OpenAI-Hoodie trug und von Aufnahmegeräten umgeben war, um zu vermuten, dass die Person möglicherweise welche zusammenstellte Ankündigung im Zusammenhang mit OpenAI.
Während der Chatbot ein paar Probleme zu haben schien, etwa wenn er eine Bildaufforderung falsch interpretierte oder ungenau zu antworten begann, bevor die Frage vollständig war, ließen diese Momente den Chatbot fast menschlicher erscheinen.
Es fühlt sich alles menschlicher an – und übertrifft das, was wir von der Konkurrenz gesehen haben
In einem Fall begann ChatGPT auf eine Aufforderung zu reagieren, bevor der Forscher die Gleichung auf der Kamera zeigte, und der Forscher stoppte den Chatbot sofort.
„Ups, ich war zu aufgeregt“, antwortete der Chatbot. „Ich bin bereit, wenn du es bist.“
Es schien auch mit Antworten zu antworten, die Gefühle der Wertschätzung nachzuahmen schienen. Als der Forscher dem Chatbot ein Bild mit der Aufschrift „Ich liebe ChatGPT“ zeigte, antwortete er mit „aw“ und sagte: „Das ist so süß von dir.“
In einem anderen Fall sagte ChatGPT, der Forscher sei errötet, als er sagte, er spreche davon, wie „nützlich und erstaunlich“ ChatGPT sei.
OpenAI gab die Ankündigungen am Tag vor Googles großer Sommerkonferenz google IO bekannt, auf der die Fortschritte des Unternehmens bei seinen verschiedenen KI-Produkten wie Gemini bekannt gegeben werden sollen.
Aber der Zeitpunkt der OpenAI-Veranstaltung – und ihre beeindruckenden Demonstrationen – werden KI-Beobachter neugierig machen, ob ChatGPT Googles Gemini voraus ist oder ob Google etwas in petto hat.
Aber vorerst zeigt das Frühjahrsupdate von OpenAI einmal mehr, wie beeindruckend ChatGPT sein kann, insbesondere wenn man es mit dem bestehenden Bereich der Sprachassistenten vergleicht.
Amazons Alexa, Apples Siri und Google sind alle auf dem Vormarsch. Ihre Sprachassistenten sind dafür bekannt, roboterhaft und direkt auf Fragen zu antworten – alles andere als wirklich gesprächig. Das neue ChatGPT powered by GPT-4o überwältigt sie mit seinen menschenähnlichen Antworten.
apple seinerseits scheint sich der Kluft zwischen noch älteren Versionen von ChatGPT und Siri bewusst zu sein. In einem kürzlich veröffentlichten Bericht heißt es, dass die Entscheidung zur Überarbeitung des iphone-Sprachassistenten getroffen wurde, nachdem Apple-Führungskräfte wochenlang mit ChatGPT herumgespielt hatten und das Unternehmen erkannte, wie dahinter steckt es war. Es gibt auch Gerüchte, dass die beiden Unternehmen darüber gesprochen haben, dass Apple das Modell von OpenAI für einige noch nicht angekündigte iPhone-Funktionen lizenzieren könnte.
Auf weitere Informationen dürften Apple-Fans nicht lange warten müssen. Es wird erwartet, dass das Unternehmen seine KI-Updates auf der Apple-Jahreskonferenz vorstellt Weltweite Entwicklerkonferenz am 10. Juni.
In der Zwischenzeit hatte Amazon Pläne, eine kostenpflichtige „Alexa Plus“-Version des Sprachassistenten herauszubringen, die auf generativer KI basiert, berichtete Eugene Kim von Business Insider erstmals. Der Assistent soll gesprächigere und personalisiertere Antworten bieten, ein Veröffentlichungsdatum ist jedoch nicht klar.
Aber genau wie bei der ersten Version von Chat GPT hat OpenAI erneut gezeigt, wie beeindruckend seine Technologie sein kann – und überlässt dem Rest der Technologiebranche den Beweis, dass es aufholen kann.
[ad_2]