Einen Tag nach der Ankündigung von GPT 4o durch chatgpt machte google Project Astra während der Google I/O 2024 offiziell. Ähnlich wie ChatGPT 4o kann Project Astra menschliche Anfragen in Echtzeit beantworten. Um die Fähigkeiten von Project Astra zu demonstrieren, zeigte Google ein Video einer Person, die in Echtzeit per Spracheingabe mit dem KI-Assistenten interagiert. ChatGPT 4o verfügt über eine ähnliche Funktionalität: Es kann in Echtzeit mit Menschen sprechen, Ausdrücke vorlesen und vieles mehr. Der Mitbegründer von OpenAI bestätigte, dass das neue Sprachmodell von Scarlett Johanssons Figur im Film Her inspiriert wurde. Wir wissen jedoch nicht, was Google inspiriert hat.
In dem von Google geteilten Demo-Video ist ein Nutzer zu sehen, der das KI-Modell auffordert, ein Objekt in einem Raum zu identifizieren, das einen Ton erzeugt. Sie dreht beiläufig die Kamera in einer scheinbaren Büroumgebung. Sie teilt dem KI-Modell nicht mit, dass sich ein Sprecher im Raum befindet, aber das KI-Modell erkennt einen Sprecher schnell. Es heißt: „Ich sehe einen Lautsprecher, der ein Geräusch macht.“ Anschließend untersucht der Benutzer das KI-Modell weiter und fordert es auf, einen Teil des Sprechers zu identifizieren.
Google sagte in seinem Blog, dass ein KI-Assistent, um wirklich hilfreich zu sein, die Welt genauso verstehen muss wie wir. Das bedeutet, dass es sich Dinge merken, den Kontext verstehen und bei Bedarf Maßnahmen ergreifen sollte. Sie möchten, dass man mit diesen Assistenten leicht und ohne lästige Verzögerungen sprechen kann, so als würde man mit einem Freund chatten.
Aber es ist harte Arbeit, KI so gut zu machen. Sie haben hart daran gearbeitet, dass ihre KI viele verschiedene Dinge versteht und schnell reagiert. Mit Project Astra haben sie prototypische Assistenten geschaffen, die Informationen sehr schnell verarbeiten können. Diese Assistenten können Videos ansehen, Sprache anhören und alles auf eine sinnvolle Weise zusammenstellen. Außerdem klingen sie jetzt menschlicher und bieten eine größere Bandbreite an Tönen.
„Um wirklich nützlich zu sein, muss ein Agent die komplexe und dynamische Welt verstehen und darauf reagieren, genau wie Menschen – und aufnehmen und sich daran erinnern, was er sieht und hört, um den Kontext zu verstehen und Maßnahmen zu ergreifen.“ Es muss außerdem proaktiv, lehrreich und persönlich sein, damit Benutzer auf natürliche Weise und ohne Verzögerungen mit ihm sprechen können. Während wir bei der Entwicklung von KI-Systemen, die multimodale Informationen verstehen können, unglaubliche Fortschritte gemacht haben, ist es schwierig, die Reaktionszeit auf etwas Konversation zu reduzieren technische Herausforderung. In den letzten Jahren haben wir daran gearbeitet, die Art und Weise zu verbessern, wie unsere Modelle wahrnehmen, argumentieren und sich unterhalten, damit sich Tempo und Qualität der Interaktion natürlicher anfühlen“, sagte Google im Blog.
Google stellt sich eine Zukunft vor, in der wir alle superintelligente KI-Assistenten in unseren Telefonen oder Brillen haben. Einige der coolen Dinge, an denen sie mit Project Astra arbeiten, werden bald in Google-Produkten verfügbar sein, wie der Gemini-App und der Website. Machen Sie sich also bereit für eine KI, die sich eher wie ein echtes Gespräch anfühlt!
Außerdem hat ChatGPT kürzlich am 13. Mai seine erste virtuelle Veranstaltung abgehalten, bei der eine Reihe von Updates vorgestellt und seine neueste Version, das GPT 4o, vorgestellt wurde. Diese weiterentwickelte Version des renommierten KI-Chatbots verspricht im Vergleich zu seinem Vorgänger ChatGPT 4 eine noch höhere Effizienz und Leistung. Parallel zu dieser Ankündigung deutete das Unternehmen erhebliche Änderungen in der Art und Weise an, wie Benutzer mit der Plattform interagieren werden.
Einer der größten Höhepunkte der Veranstaltung war die Enthüllung eines KI-Sprachassistenten durch ChatGPT, der auffällige Parallelen zu Scarlett Johanssons Charakter im Film „Her“ zog. Obwohl Details über die Verbindung mit Johansson geheim gehalten wurden, diente Sam Altmans Tweet „Her“ als subtile Bestätigung der Ähnlichkeit zwischen der kommenden Sprachassistentin und Johanssons ikonischer Darstellung im Film.