Im Jahr 2023 startete chatgpt durch und das Online-KI-Tool wurde so groß, dass sogar Ihr Onkel, der ständig offline ist und kein Telefon besitzt, sich dessen vollständig bewusst war. Aber während OpenAI sein Wunderkind weiter poliert und verbessert, gibt es einen Konkurrenten, der bereit ist, die Macht zu übernehmen.

Kurz nach dem Start von ChatGPT machte google eine Ankündigung in Form von Bard. Als Konkurrent des OpenAI-Dienstes könnte Bard alles tun, was ChatGPT tun könnte, jedoch mit der Macht der weltweit größten Suchmaschine im Rücken.

Jetzt macht Google mit seinem neuen Projekt mit dem Titel Google Gemini, das derzeit eingeführt wird, einen weiteren Schritt nach vorne. Da es ChatGPT offenbar bereits übertrifft, fragen sich viele von uns: Wird Google im Jahr 2024 den KI-Spitzenplatz einnehmen?

Was ist Google Gemini und wie funktioniert es?

Wenn es um OpenAI geht, ist ChatGPT das Tool, das jeder kennt. Aber damit dieses Tool funktioniert, muss es von etwas angetrieben werden – und hier kommt GPT-4 ins Spiel. GPT-4 ist ein großes Sprachmodell, das auf Milliarden von Datensätzen aus dem gesamten Internet trainiert wird, um Bilder, Texte, Kontext usw. zu verstehen viele andere Faktoren.

Im Fall von Google ist dies Gemini, die Engine, die wie Bard seine Programme für künstliche Intelligenz ausführt.



Gemini wurde von Grund auf entwickelt und nutzt Teams aus ganz Google. Gemini kann Inhalte verallgemeinern und verstehen, einschließlich Text, Code, Audio, Bild und Video. Wie GPT-4. Gemini wurde mit einem riesigen Datensatz trainiert, der Bücher, Artikel, Code-Repositories, Musik, Audioaufnahmen und andere Medienformen umfasste.

Siehe auch  ChatGPT, was dich dumm machen wird?

Alle diese Daten werden in eine für Zwillinge verständlichere Form aufgeschlüsselt. Das Modell lernt dann die Beziehungen zwischen verschiedenen Begriffen und Medien und lernt, wie es auf Aufforderungen, Fragen und Vorschläge reagiert.

So testen Sie Google Gemini kostenlos

Derzeit gibt es zwei Möglichkeiten, Google Gemini zu testen, eine davon ist zugänglicher als die andere. Für die meisten Menschen ist es am einfachsten, sich beim Chatbot des Unternehmens anzumelden. Google Barddas derzeit auf einer Testversion von Gemini basiert.

Wenn Sie Google Bard noch nicht verwendet haben, können Sie einfach ein Konto erstellen und sofort mit der Nutzung beginnen. Die Vollversion von Gemini Google, die das Unternehmen derzeit bewirbt, wird voraussichtlich in naher Zukunft über Bard erhältlich sein.

Was kann die Testversion also? Es gibt immer noch einige Einschränkungen bei dem Modell, und obwohl Gemini es intelligenter gemacht hat, erwarten Sie nicht jedes Mal einwandfreie Antworten.

Obwohl Google Bard Jetzt Intelligenter Ist, Kann Es Immer Noch Eindeutige Fehler Machen.

Wir haben dieser aktualisierten Version von Bard eine Vielzahl von Aufgaben gegeben. In den meisten Fällen schnitt es gut ab, es erstellte ganze Coderollen, verstand die Logik und zeigte etwas kreativen Witz.

Es war jedoch nicht immer korrekt. Als beispielsweise ein Bild von fünf übereinander gestapelten grauen Schuhen gezeigt wurde, wurden 27 Paar identifiziert – 49 Schuhe mehr als auf dem Bild gezeigt. Es hieß auch, dass sie in einer riesigen Pyramide gestapelt seien und verschiedene Farben zeigten … das war nicht der Fall.

Was ist also der zweite Weg, um auf Gemini zuzugreifen? Für alle, die stolzer Besitzer eines Google Pixel 8 Pro sind, ist Gemini Nano (die schwächste Version von Gemini – mehr dazu weiter unten) über einige Funktionen zugänglich, die größtenteils in WhatsApp, Google Keyboard und die Rekorder-App integriert sind.

Siehe auch  Code Llama von Meta ist jetzt herausgekommen, um ChatGPT herauszufordern und Programmierern und IT-Ingenieuren bei der Arbeit zu helfen

Was können Zwillinge tun?

In den letzten Wochen hat Google unermüdlich daran gearbeitet, seine Gemini-Technologie zu präsentieren, Videos seiner Fähigkeiten zu veröffentlichen und seine Fähigkeiten im Vergleich zu seinen Konkurrenten zu verbessern. Obwohl diese beeindruckend sind, sind sie alle sehr kontrolliert, sodass es schwierig ist, genau zu wissen, wie gut Zwillinge funktionieren werden.

In einem inzwischen ziemlich aktuellen viralen Google-Video ist eine Person zu sehen, wie sie verschiedene Objekte zeichnet, während Gemini in Echtzeit beschreibt, was gezeichnet wird. Besser noch: Gemini beantwortet Fragen zu den gezeichneten Objekten, spricht in verschiedenen Sprachen und macht sogar Spiele aus den gezeigten Bildern.

Obwohl das Video sicherlich bemerkenswert ist, gibt es einen etwas trügerischen Haken. Gemini beantwortet Fragen, die ihm gestellt werden, nicht in Echtzeit, wie das Video andeutet. Stattdessen werden die Fragen separat mit etwas mehr Kontext gefüttert. Immer noch beeindruckend, aber nicht ganz das überwältigende Erlebnis, das das Video vermittelt.

YouTube Video

An anderer Stelle hat Google gezeigt Zwillinge erraten Filme aus kombinierten Bildern – Zeigen Sie ihm ein Bild von Pfannkuchen und Speck neben einem Bild von Menschen, die auf einem Rave tanzen, bitten Sie es, den Namen des Films zu erraten, und es sollte in der Lage sein, richtig zu antworten (fünf Punkte, wenn Sie es gesagt hätten). Der Frühstücks-Club). Es kann auch erraten werden wann bestimmte Kleidungsstücke getragen werden sollen (z. B. große Mäntel sind für kaltes Wetter), Verbindungen zwischen verschiedenen Wörtern und Bildern finden und Erklären Sie die Mathe-Hausaufgaben Ihres Kindes für dich.

Da Zwillinge letztlich mit Wörtern, Bildern, Videos, Code und den meisten Formen digitaler Inhalte trainiert werden, sind ihre Fähigkeiten wohl endlos.

Google Gemini vs. GPT-4: Was ist besser?

Die oben genannten Fähigkeiten sind nichts Neues. Das ist genau das, was OpenAI zuvor mit GPT-4 getan hat, und sogar Google hat in der Vergangenheit solche Modelle ausgeführt. Was Gemini jedoch auszeichnet, ist einfach die Tatsache, dass es besser ist … oder zumindest sagt Google das.

Siehe auch  George RR Martin und John Grisham verklagen OpenAI, den Eigentümer von ChatGPT

Gemini hat GPT-4 in 30 der 32 Kategorien geschlagen, in denen das Wissen, die Argumentation, die Wahrnehmung und mehr der Modelle getestet werden. Tatsächlich ist Gemini mit einer Punktzahl von 90 Prozent das erste Modell, das menschliche Experten in einem umfangreichen Multitasking-Sprachverständnistest übertrifft.

Das bedeutet eine Kombination aus 57 Fächern aus den Bereichen Mathematik, Physik, Geschichte, Recht, Ethik, Medizin und einer Sammlung weiterer Wissens- und Problemlösungsaufgaben. Beeindruckend, oder? Nun, hier gibt es eine Art Fußnote.

Da dies alles von Google selbst untersucht wurde, gibt es außerhalb kontrollierter Tests keine Möglichkeit, mit Sicherheit zu sagen, wie gut es abschneidet. Im Gegensatz zur Taktik von OpenAI, seine Tools schnell der Öffentlichkeit zugänglich zu machen, lässt sich Google gerne Zeit.

Alle diese beeindruckenden Statistiken wurden ebenfalls von Gemini Ultra erreicht – der leistungsstärksten Version des Modells. Google plant die Veröffentlichung von drei Versionen von Gemini: den voll ausgestatteten Ultra-, Pro- und Nano-Versionen.

Realistisch gesehen werden die meisten Menschen auf der Welt die beiden weniger intelligenten (und wahrscheinlich günstigeren) Versionen des Modells verwenden. Es ist noch nicht klar, wie sich diese Modelle unterscheiden werden, aber Google hat es vage dargelegt.

Nano ist für schnelle mobile Aufgaben gedacht, Pro ist ein vielseitiger Mittelweg und Ultra ist die robusteste Option. Wenn überhaupt etwas mit den GPT-Modellen von OpenAI vergleichbar ist, bedeutet dies eine höhere Wortzahl, Geschwindigkeit und mehr Funktionen mit leistungsstärkeren Versionen.

Mehr lesen:

Anzeige
Nina Weber
Nina Weber is a renowned Journalist, who worked for many German Newspaper's Tech coloumns like Die Zukunft, Handelsblatt. She is a contributing Journalist for futuriq.de. She works as a editor also as a fact checker for futuriq.de. Her Bachelor degree in Humanties with Major in Digital Anthropology gave her a solid background for journalism. Know more about her here.