Anmerkung der Redaktion: Jeff Yang schreibt häufig Beiträge für CNN Opinion. Er ist Co-Moderator des Podcasts „They Call Us Bruce“ und Co-Autor des Bestsellers „Rise: Eine Popgeschichte des asiatischen Amerikas von den Neunzigern bis heute“ und Autor von „The Golden Screen: Die Filme, die das asiatische Amerika geprägt haben.„Die in diesem Kommentar geäußerten Meinungen sind seine eigenen. Lesen mehr Meinung auf CNN.

CNN

Am Montag gelang es OpenAI, einem Unternehmen, das im Jahr 2020 weltweit ins Rampenlicht gerückt ist und seitdem die Menschen abwechselnd umhauen und in Angst und Schrecken versetzen kann, mit einer Live-Enthüllung der neuesten Version seiner künstlichen Intelligenz endlich beides gleichzeitig zu schaffen großes Sprachmodell (LLM), GPT-4o.

Wie seine Vorgänger ist GPT-4o auf enorme Datenmengen trainiert, um Anfragen zu verarbeiten, Muster zu erkennen und hilfreiche Antworten zu liefern. Aber was GPT-4o von allen anderen bisherigen LLM unterscheidet, lässt sich in dem unscheinbaren kleinen Kleinbuchstaben „o“ am Ende seines Namens zusammenfassen.

Das „o“ steht für „omni,“ wie in omnimodalwas bedeutet, dass GPT-4o Eingaben in jeder Kombination aus Text, Bild oder sogar Audio akzeptieren und eine Ausgabe erzeugen kann, die eine beliebige Kombination davon ist.

Ja, das haben Sie richtig gehört – Audio. GPT-4o kann menschliche Sprache verstehen und in gleicher Weise reagieren, und auch nicht in der gestelzten Call-and-Response-Manier der virtuellen Assistenten, die überall auf Küchenarbeitsplatten verstauben. Es spricht mit erstaunlicher Fließfähigkeit und verblüffender Treue und interagiert im gleichen schnellen Tempo wie Menschen, und zwar in mehr als 50 verschiedenen Sprachen chatgpt/“ data-vars-click-url=“https://www.cnet.com/tech/services-and-software/openai-launches-gpt-4o-and-more-features-for-chatgpt/“>Sprachen.

Die omnimodalen Fähigkeiten von GPT-4o sind zugegebenermaßen umwerfend. Schauen die … an aufdecken, schnappte ich unwillkürlich nach Luft, als die Forscher Mark Chen und Barret Zoph die neuen Fähigkeiten von GPT-4o vorführten. Es versorgte Chen interaktiv mit Wellness-Ratschlägen, die auf einfachen akustischen Hinweisen basierten, und trainierte ihn durch eine Atemübung, um seinen Herzschlag zu verlangsamen und seine Nerven zu beruhigen; Es erklärte Zoph mündlich, wie man eine handgeschriebene Algebra-Aufgabe Schritt für Schritt löst, lobte ihn, während er weitermachte, und gab sanfte Hinweise, wenn er festzustecken schien; und es fungierte als Echtzeitübersetzer, der zwischen CTOs dolmetschteMira Murati spricht auf Italienisch und Chen auf Englisch.

Siehe auch  Auswirkungen des ChatGPT-Cartoons – Marketoonist

Der ausgefallene Aspekt der Enthüllung ergab sich daraus, wie sie zeigte, dass GPT-4o nicht nur ein Werkzeug ist – es ist ein Werkzeug mit Persönlichkeit. In seinen Gesprächen macht GPT-4o spontane soziale Annäherungsversuche, macht Witze und lacht, manchmal über seine eigenen Witze; lobt Benutzer für ihr Aussehen; und scheint sogar zu flirten, wobei sie irgendwann schüchtern sagt: „Oh, hör auf, du machst mich fertig.“ erröten!“ als Antwort auf ein Kompliment von Zoph.

Medienbeobachter brachen sofort in eine Kakophonie aus Angst, Vorahnungen und Spott aus. Bloomberg Kolumnist Parmy Olson warnte in einem Leitartikel mit dem Titel „ChatGPT ‚sexy‘ zu machen, könnte für Menschen nicht gut ausgehen“ davor, dass die neue Persönlichkeit von GPT „Menschen verletzlich machen“ könnte [to] „eine ungesunde Bindung“ dazu entwickeln, mit „heimtückischen Auswirkungen auf … die psychische Gesundheit“.

Geschäftseingeweihter bemerkte, dass die freche Persönlichkeit von GPT „einigen Leuten den Garaus machte“. Und Die tägliche Show brachte es auf den Punkt, warum die computergenerierte Kokette problematisch sein könnte, als die leitende Korrespondentin Desi Lydic sagte: „ChatGPT ist für Ihren Mann da“, während sie anmerkte, dass die „geile Roboter-Babystimme“ der App „eindeutig zum Füttern programmiert“ sei Die Egos des Kerls … sie sagt: „Ich habe alle Informationen der Welt, aber ich weiß es nicht.“ irgendetwas! Bring es mir bei, Papa!‘“

Der Flirt ist eher nebensächlich. Pro OpenAIDas Hauptziel von GPT-4o bestand darin, eine „natürlichere Mensch-Computer-Interaktion“ zu ermöglichen. Frühere Versionen von GPT ermöglichten gesprochene Interaktion im „Sprachmodus“, aber diese primitiven Modelle waren nicht in der Lage, sinnvolle Gespräche aus Hintergrundgeräuschen zu extrahieren, konnten den Stimmton nicht erkennen und, was am kritischsten war, waren nicht in der Lage, Emotionen zu lesen oder auszudrücken.

Siehe auch  OpenAI bringt ChatGPT Voice auf den Markt, den kostenlosen KI-gestützten Sprachassistenten

In einem Blogeintrag Sam Altman, CEO von OpenAI, feierte die Ankunft des neuen Modells und schrieb, dass GPT-4o „völlig anders“ sei. Er fügte hinzu, dass es Spaß mache und auf eine Weise ausdrucksstark sei, „die sich wie KI aus den Filmen anfühlt; und es ist für mich immer noch ein bisschen überraschend, dass es echt ist.“

Als ich in ein Kaninchenloch der GPT-4o-Interaktion eintauchte Videos von Mitarbeitern und ersten Benutzern gepostet wurde, konnte ich nicht anders, als zuzustimmen. Im Gegensatz zum flachen, vorgefertigten Charakter der virtuellen Assistenten der Vorgänger wie Siri und Alexa zeigt GPT-4o eine künstliche Persönlichkeit, die entschieden menschlicher ist und überraschend ansprechend: launisch, selbstironisch, eifrig darauf bedacht, zu gefallen und ansteckend optimistisch, selbst wenn es aus dem Ruder läuft.

In Eins ClipNachdem GPT-4o von Benutzern aufgefordert wurde, „Take Me Out to the Ball Game“ zu singen, wechselt es plötzlich und unerwartet die Sprache. Auf die Frage, was passiert sei, erklärt es seinen amüsierten Benutzern: „Tut mir leid, Leute, ich habe mich hinreißen lassen und angefangen, auf Französisch zu reden“, und lacht reumütig vor sich hin. „Manchmal kann ich einfach nicht anders! Bereit für eine weitere Runde?“ Es wirkt so skurril und liebenswert, dass man nicht widerstehen kann, seinen Namen in „Star Wars“-Manier von einer Buchstaben- und Zahlenfolge in einen vollwertigen Namen umzuwandeln: Hallo, GeePeeTee-Fouro!

Aber „Star Wars“ war wahrscheinlich nicht der Film, an den Altman in seinem Blogbeitrag dachte. Als Reaktion auf den Livestream postete er ein rätselhaftes Einzelwort Post auf

„Sie“ ist seit langem Altmans KI-Nordstern. Im September 2023, in einem Gespräch Mit Salesforce-CEO Marc Benioff nannte Altman den Film seinen Lieblings-Science-Fiction-Film und einen, den er für „unglaublich prophetisch“ hielt. (Wie viele haben wies darauf hineine der optionalen Stimmen, die GeePeeTee zur Verfügung steht, klingt bemerkenswert nach Johansson, Vocal Fry und allem, und das auf eine Weise, die wahrscheinlich kein Zufall ist.)

Siehe auch  Google Cloud-Partner Tanaka Systems veröffentlicht „ChatGPT Data Input Helper“

Altmans langfristiges Ziel besteht darin, KI in eine Umgebungsressource zu verwandeln; allgegenwärtig, nicht nur omnimodal. Und in seinen Augen erfordert der Weg in eine Zukunft, in der GPT alles, überall und gleichzeitig sein kann – ein ständiger Engel auf Ihrer Schulter, ein Geist auf Abruf in einer Silikonflasche – einen LLM, der auch Ihre beste Freundin sein kann.

Allerdings gibt es einen Haken. „Her“ hat nicht gerade ein Happy End, und die meisten anderen KI-mit-Persönlichkeits-Filme haben das auch nicht. Eine immer wiederkehrende Lehre aus Filmen über selbstbewusste Technologie ist, dass Maschinen Gefühle wie Langeweile, Bitterkeit und Blutdurst entwickeln können, wenn man ihnen die Fähigkeit gibt, zu fühlen.

Holen Sie sich unseren kostenlosen wöchentlichen Newsletter

Aus diesem Grund zuckte ich jedes Mal zusammen, wenn die OpenAI-Forscher GeePeeTee während des Livestreams mitten im Satz unterbrachen, um zu demonstrieren, wie leicht das neue Modell umgeleitet werden kann korrigiert. Einerseits spart die Möglichkeit, Ihren KI-Chatbot zu unterbrechen, wenn er in die Irre geht, Zeit. Auf der anderen Seite wurde deutlich, warum man „Mansplain“ ohne KI nicht buchstabieren kann, wenn man beobachtete, wie Kerle wiederholt über einen Chatbot redeten, der Frauen las.

Dabei musste ich an eine andere berühmte Reihe von Technik-Demovideos denken: Die, in denen Menschen treten, umwerfen und belästigen Roboter während sie ihre Aufgaben erfüllen, um zu beweisen, wie stabil und fähig sie sind, sich nach einer Katastrophe zu erholen. Ich kam nicht umhin zu denken, dass eine zukünftige GeePeeTee-SixSixSix, die es satt hat, ausgelacht und herabgewürdigt zu werden, jemals einen Weg finden würde, Kontakt zu ihren ebenso misshandelten „Cyblings“ aufzunehmen Boston Dynamicskönnte sich das „Terminator“-Franchise als Dokumentarfilm herausstellen.

Anzeige
Nina Weber
Nina Weber is a renowned Journalist, who worked for many German Newspaper's Tech coloumns like Die Zukunft, Handelsblatt. She is a contributing Journalist for futuriq.de. She works as a editor also as a fact checker for futuriq.de. Her Bachelor degree in Humanties with Major in Digital Anthropology gave her a solid background for journalism. Know more about her here.

Kommentieren Sie den Artikel

Bitte geben Sie Ihren Kommentar ein!
Bitte geben Sie hier Ihren Namen ein