Während google sein neues generatives KI-Modell namens Gemini veröffentlicht, führt Sie Adarsh ​​durch alles, was wir bisher darüber wissen.


Seit dem Debüt von chatgpt befindet sich Google in einer Aufholjagd. Die erste Reaktion, Bard, war im Vergleich dazu nicht vergleichbar, also mussten sie Ressourcen bündeln, um ein verbessertes generatives KI-Modell zusammenzustellen, das es mit ChatGPT aufnehmen konnte.

Um dies zu erreichen und seine KI-Forschung voranzutreiben, hat das Unternehmen seine KI-Abteilungen Google Brain und Deepmind zusammengelegt. Und so wurden Zwillinge geboren.

Laut einem Artikel veröffentlicht von Google kündigt den Start von Gemini an kann verschiedene Arten von Informationen, einschließlich Text, Bilder, Audio, Video und Code, verallgemeinern und nahtlos verstehen, verarbeiten und kombinieren. Das Modell wird als bedeutender Fortschritt in der Verarbeitung natürlicher Sprache beworben und Google nennt es „unser größtes Wissenschafts- und Technikprojekt aller Zeiten“.

Erhältlich in 3 Modellen

Google Gemini ist in drei Modellen erhältlich:

1. Zwillinge Ultra

2. Gemini Pro

3. Zwillinge Nano

Ultra ist das größte und leistungsstärkste der drei Geräte und wurde für hochkomplexe Aufgaben entwickelt, während Pro besser für die Bewältigung einer Vielzahl von Aufgaben geeignet ist. Nano ist für Android-Benutzer gedacht, die Gemini-basierte Apps erstellen möchten. Mit Gemini Nano können Benutzer jetzt beispielsweise Aufnahmen zusammenfassen, die mit der Recorder-App auf dem Pixel 8 Pro-Telefon erstellt wurden (jedoch nur auf Englisch).

In einer kürzlichen Pressekonferenz sagte Sissie Hsiao, Vizepräsidentin von Googles KI-Chatbot Bard, dass Gemini Pro GPT-3.5 in sechs der acht Branchen-Benchmarks übertroffen habe. Googles fortschrittlichstes Modell, Gemini Ultra, schlug das neuere GPT-4 in sieben der acht Benchmarks.

Siehe auch  So beheben Sie zu viele ChatGPT-Anfragen in einer Stunde: Leitfaden zur Fehlerbehebung

Was die Zukunft bringt

Google hat bei der Markteinführung großen Wert darauf gelegt und Gemini wiederholt als die leistungsfähigste und vielseitigste KI gepriesen, die das Unternehmen bisher entwickelt hat. Sie planen außerdem, die erweiterte Version dieses großen Sprachmodells (LLM) im nächsten Jahr zu erweitern. Das LLM ist multimodal, was bedeutet, dass es verschiedene Arten von Informationen verstehen kann, darunter Text, Audio, Bilder und Video.

Das LLM läuft auf von Google hergestellten Tensor-Processing-Einheiten (TPUs), spezieller Hardware, die für das Training von KI-Modellen entwickelt wurde. Aber in Zukunft werde Gemini sowohl auf TPUs als auch auf Grafikprozessoren (GPUs) trainiert, sagte Amin Vahdat, Vizepräsident von Googles Cloud AI, in einem Briefing. Nvidia stellt die H100-GPU her, einen beliebten Chip für generative KI-Produkte.

Bard erhält ein Update

Bard steht ebenfalls vor einer lange bevorstehenden Umgestaltung. Es wurde jetzt mit Gemini Pro aktualisiert, was dem Chatbot unter anderem erweiterte Argumentations- und Verständnisfähigkeiten verleiht.

Laut Google wird Bard im Jahr 2024 auch in Gemini Ultra integriert. In den kommenden Monaten wird das Unternehmen Gemini in seine anderen Apps integrieren, darunter die Suche, Google Ads und den Chrome-Browser.

YouTube Video
Gemini: Googles neuestes und leistungsfähigstes KI-Modell.

Inspiriert von AlphaGo

Gemini hat AlphaGo zu verdanken, das von Googles DeepMind entwickelt wurde und das erste Computerprogramm war, das einen professionellen menschlichen Go-Spieler besiegte. KI-Geschichte wurde bereits 2016 geschrieben, als AlphaGo Lee Sedol, einen der weltbesten Go-Spieler, in seinem eigenen Spiel besiegte.

Die in AlphaGo verwendeten Techniken wurden mit der Technologie, die ChatGPT antreibt, kombiniert, um Gemini zu erstellen. In einem Interview Mitte 2023, Demis Hassabis, die Chefin von DeepMind hatte dies erklärt: „Auf einer hohen Ebene kann man sich Gemini als eine Kombination einiger Stärken von Systemen vom Typ AlphaGo mit den erstaunlichen Sprachfähigkeiten der großen Modelle vorstellen.“

Siehe auch  Heilige Kuh, ChatGPT kann Worte für Emotionen schaffen, von denen wir nie wussten, dass wir sie haben

Das letzte Wort

Angesichts der Anstrengungen, die in Gemini gesteckt wurden, und der Art und Weise, wie Google es angepriesen hat, ist dies ihre nächste große Wette, und jetzt, da es offiziell eingeführt wurde, können Sie in den kommenden Monaten mit mehreren Ergänzungen und Upgrades rechnen.

Haben Sie Gemini schon ausprobiert? Was davon hat Sie am meisten beeindruckt? Lassen Sie es uns im Kommentarbereich wissen.

Falls Sie es verpasst haben:

Anzeige