google sagte in einer Pressekonferenz am Mittwoch, dass sein neuestes KI-Modell, Gemini 1.5 Flash, 20 % schneller sei als der neueste Bot von OpenAI, chatgpt-4o.
Google gab am Donnerstag bekannt, dass Gemini 1.5 Flash jetzt für die breite Öffentlichkeit verfügbar ist. Der KI-Chatbot wurde erstmals angekündigt bei Google I/O im Mai und ist seit dem letzten Monat als öffentliche Vorschau verfügbar, d. h. Kunden konnten das Produkt testen und Feedback geben. Gemini 1.5 Flash kann eine Stunde Video analysieren11 Stunden Audiomaterial oder mehr als 700.000 Wörter in einer Abfrage, anstatt dass Benutzer ihre Fragen in Abschnitte aufteilen müssen. In einer Präsentation vor Journalisten zeigte Google, wie der Bot ein 14-minütiges Video in einer Minute analysieren konnte.
Google sagte, der neueste KI-Bot sei zudem 40 % schneller als ChatGPT-3.5-Turbo und habe eine höhere Informationskapazität. Mit anderen Worten: Benutzer können in ihre Fragen an Gemini 1.5 Flash viel mehr Kontext einbeziehen – sei es Audio, Video, Code oder Text – und erhalten im Gegenzug offenbar genauere Antworten.
„Es ist das schnellste Modell mit dem besten Preis-Leistungs-Verhältnis auf dem Markt“, sagte Google Cloud CEO Thomas Kurian. Gemini 1.5 Flash ist für Entwickler verfügbar in begrenztem Umfang kostenlos und darüber hinaus zu variablen Preisen, abhängig davon, wie viele Daten der Benutzer eingeben möchte.
Gemini 1.5 Pro ist etwa zehnmal so teuer, wird aber von Google als das „beste Modell“ bezeichnet. Es kann sogar noch mehr Kontext aufnehmen: 22 Stunden Audio und 1,5 Millionen Wörter. „Sie können mit einer einzigen Abfrage die gesamte Unternehmensgeschichte durchgehen, was 10 Jahre Finanzberichte umfassen kann“, sagte Kurian.
Google gab an, dass die jüngsten Updates für Gemini 1.5 Flash, sein Flaggschiffmodell Gemini 1.5 Pro und seinen Bildgenerator Imagen 3 sein KI-Softwarepaket zur „unternehmenstauglichsten generativen KI-Plattform“ auf dem Markt machen. Das Unternehmen nannte mehrere Unternehmenskunden, die seine Produkte verwenden, darunter UberEats, Moody's und Shutterstock.
Diese Kunden wenden sich unter anderem aufgrund eines neuen Updates der KI an Google: die beschleunigten „Grounding“-Fähigkeiten, die am Donnerstag angekündigt wurden. Gemini-Modelle zeigen nun Antworten an, die mit einer Quelle mit Link verknüpft sind (d. h. angehängt sind). Diese Antworten erhalten außerdem eine Grounding-Bewertung (d. h. Vertrauenswürdigkeit).
„…diese Elemente sind darauf ausgelegt, die Sachlichkeit zu verbessern und Halluzinationen deutlich zu reduzieren.“ – Thomas Kurian, CEO von Google Cloud, über die neuen Faktenprüfungs- oder „Grounding“-Funktionen des Unternehmens.
Nick Reed, Chief Product Officer bei Moody's Analytics, sagte gegenüber Reportern: „Die Grundlagenbildung ist ein ziemlich grundlegender Prozess, um generative KI für Entscheidungsprozesse nutzen zu können, insbesondere bei Finanzdienstleistungen.“ Das Finanzdienstleistungsunternehmen ist Kunde von Google Gemini 1.5 Flash.
Google kündigte zudem an, im dritten Quartal ein neues branchenspezifisches Grounding-Tool auf den Markt zu bringen, das es etwa Finanzanalysten ermöglichen soll, ihre KI-Abfragen auf Daten von Moody's abzustützen, oder Rechtsexperten, ihre Fragen auf Quellen von Thomson Reuters abzustützen.
In Zahlen
60 %: Darüber, wie stark der Gewinn von Google im ersten Quartal teilweise dank KI gestiegen ist.
22: Gemini 1.5 Pro kann stundenlanges Audiomaterial analysieren.
1: Minuten benötigt Gemini 1.5 Flash, um ein 14-minütiges Video zu analysieren.
20 %: Wie viel schneller Gemini 1.5 Flash laut Google im Vergleich zu ChatGPT-4o ist.