In der sich ständig weiterentwickelnden Welt der KI wurde mit der Einführung von Googles neuestem Modell, Gemini, ein großer Durchbruch erzielt. Gemini wurde von Grund auf multimodal konzipiert und stellt einen erheblichen Fortschritt beim Verständnis seiner Umgebung und seines Kontexts dar. Bei den meisten akademischen Benchmarks übertrifft es frühere Modelle wie GPT-4.

Was kann diese KI?

Dieses revolutionäre Modell beschränkt sich nicht nur auf die Textanalyse, sondern zeichnet sich auch durch das Verständnis von Bildern und Audiotexten aus und kann eine Vielzahl von Informationen verarbeiten, indem es diese nahtlos kombiniert. Ein besonders beeindruckendes Merkmal von Gemini ist seine Fähigkeit, Musik einfach durch die Analyse eines Bildes zu erzeugen, was die Leistungsfähigkeit seines multimodalen Ansatzes veranschaulicht.

Gemini ist nicht nur in der Lage, multimodale Inhalte zu verstehen und zu generieren, sondern zeichnet sich auch durch Problemlösung und Spieleerstellung aus und bietet Übersetzungsfunktionen in allen Sprachen, begleitet von Ausspracheerklärungen. Diese Vielseitigkeit macht Gemini in verschiedenen Anwendungen äußerst leistungsfähig.

Im Vergleich zu seinem direkten Konkurrenten, dem GPT-4 von OpenAI, sticht Gemini in 30 von 32 akademischen Benchmarks hervor und setzt damit einen neuen Standard im Bereich KI. Interessant ist jedoch, dass der Wettbewerb zwischen diesen KI-Giganten oft durch die spezifische Art der Aufgaben beeinflusst wird, wobei google insbesondere im multimodalen Management hervorsticht.

Drei verschiedene Größen

Die Bereitstellung von Gemini erfolgt in drei verschiedenen Phasen, wobei die Größe an unterschiedliche Aufgaben angepasst ist. Die Ultra-Version ist für die komplexesten Aufgaben gedacht, die Pro-Version ist für die meisten Anforderungen konzipiert und die Nano-Version ist für „eingebettete“ Aufgaben gedacht, die direkt auf einem Gerät ohne Umweg über die Cloud ausgeführt werden.

Siehe auch  Wikipedia 2023 abgeschlossen: ChatGPT an Oppenheimer, 25 meistgelesene Artikel

Derzeit ist die Gemini Pro-Version in Bard integriert, den Chatbot von Google, der mit chatgpt konkurriert. Allerdings ist es nur auf Englisch verfügbar und auf 170 Länder beschränkt, zunächst ausgenommen Länder der Europäischen Union.

Google verspricht, mit Gemini Ultra noch weiter zu gehen, das Anfang nächsten Jahres in einer „erweiterten“ Version von Bard bereitgestellt wird. Diese kostenpflichtige Version folgt dem ChatGPT Plus-Modell und bietet die Nutzung von Gemini für ein monatliches Abonnement von 20 Dollar.

Schließlich wird die Nano-Version von Gemini neue Funktionen für das Pixel 8 Pro bringen, Googles neuestes High-End-Smartphone, das im Oktober auf den Markt kam. Diese Integration verspricht ein außergewöhnliches Benutzererlebnis direkt auf dem Gerät und ebnet den Weg für eine neue Ära eingebetteter KI.

YouTube Video

Anzeige
Nina Weber
Nina Weber is a renowned Journalist, who worked for many German Newspaper's Tech coloumns like Die Zukunft, Handelsblatt. She is a contributing Journalist for futuriq.de. She works as a editor also as a fact checker for futuriq.de. Her Bachelor degree in Humanties with Major in Digital Anthropology gave her a solid background for journalism. Know more about her here.

Kommentieren Sie den Artikel

Bitte geben Sie Ihren Kommentar ein!
Bitte geben Sie hier Ihren Namen ein