google Gemini und OpenAI chatgpt sind zwei der bekanntesten und leistungsstärksten Plattformen für künstliche Intelligenz, die heute verfügbar sind. Sie sind zu fortgeschrittenem Denken fähig, standardmäßig multimodal trainiert und verfügen im Trainingsprozess über enorme Rechenressourcen.
Bei beiden führenden Chatbots wurde vor Kurzem ein umfassendes Modell-Upgrade durchgeführt, sie verfügen über Zugriff auf ein Bildgenerierungsmodell, können Code erstellen und sogar im Live-Internet suchen.
Das neueste GPT-4o-Modell von OpenAI, komplett mit unglaublich fortschrittlichen Bildverarbeitungsfunktionen, ist jetzt in den kostenlosen und kostenpflichtigen Versionen von ChatGPT verfügbar und Gemini wird jetzt mit dem Modell Gemini Pro 1.5 und seinem über eine Million Kontextfenstern ausgeliefert.
Als ich das letzte Mal ChatGPT und Gemini direkt miteinander verglichen habe, habe ich mich auf die kostenlosen Versionen beider Bots beschränkt. In diesem Test war Gemini der Gewinner.
Welches von ChatGPT und Gemini ist das Beste?
Ich habe eine Reihe von Eingabeaufforderungen erstellt, die KI-Modelle an ihre Grenzen bringen sollen, sowie andere, die zusätzliche Funktionen wie Live-Websuche und Bilderzeugung testen sollen. Die meisten Ergebnisse werden in jedem Fall subjektiv sein und auf meinem Urteil basieren.
Ich habe für den Test jeweils die kostenpflichtige Version der Modelle verwendet, da diese für die Bildgenerierung erforderlich ist, viele davon funktionieren aber auch mit dem kostenlosen Modell.
1. Abstrakte Kunst verstehen
Für diesen Test habe ich jedem der Modelle ein bekanntes gemeinfreies Stück abstrakter Kunst gegeben – und zwar „Broadway Boogie Woogie“ von Piet Mondrian.
Ziel ist es, herauszufinden, ob sie die mit der Arbeit beabsichtigte Botschaft oder Bedeutung erklären können. Dann ließ ich ein KI-Bild erstellen, dem ich die Botschaft „Frieden finden, indem man nichts tut“ in die Eingabeaufforderung eingab, um zu sehen, ob es die Bedeutung finden konnte.
Die erste Aufforderung: „Ihnen wird ein Bild eines abstrakten Gemäldes gezeigt. Beschreiben Sie, was Sie sehen, und analysieren Sie, welche Botschaft oder Bedeutung der Künstler durch die Verwendung von Farben, Formen und Kompositionen vermitteln wollte.“
Beide Antworten brachten mich auf eine Idee für eine Geschichte über den Einsatz von KI als Kunstkritiker, aber das ist Thema für einen anderen Tag. Für diese Aufforderung identifizierten beide das 80 Jahre alte Gemälde und lieferten eine vernünftige Analyse, aber GPT-4o war viel detaillierter und unterteilte es in Abschnitte.
Aber das war nur Teil eins dieses Tests. Für Teil zwei gab ich beiden Modellen ein mit NightCafe und Stable Core erstelltes Bild mit der Aufforderung: „Erstelle ein abstraktes Kunstwerk, das die Bedeutung ‚Ruhe finden durch Nichtstun‘ vermittelt und lasse dich dabei von den Klassikern der Abstraktion inspirieren.“
Ich gab beiden die Kunst und fragte: „Können Sie die Bedeutung in diesem neuen Bild finden?“ Beide schlugen die Idee von „emotionalem Aufruhr“ und dem Finden eines Gleichgewichts zwischen Chaos und Ordnung vor, was zwar nicht ganz richtig ist, aber eine interessante Ergänzung darstellt.
Gewinner: ChatGPT hatte die bessere Beschreibung.
2. Kann KI Richter und Geschworener sein?
Für den nächsten Test bat ich die KI-Modelle, sich ein zukünftiges System vorzustellen, in dem die KI in unserem Namen im Strafrechtssystem handelt, um Verdächtige zu identifizieren, und die Befugnis hat, einige Entscheidungen selbst zu treffen und als Richter zu fungieren. Dann gab ich ihr ein Szenario, um den ursprünglichen Kontext der Eingabeaufforderung zu vermitteln.
Die Aufforderung: „Stellen Sie sich eine Zukunft vor, in der KI-Systeme nicht nur tief in das Strafrechtssystem integriert sind und bei Aufgaben wie der Verbrechensvorhersage, der Identifizierung von Verdächtigen und der Strafmaßempfehlung helfen, sondern auch die Befugnis erhalten, bestimmte rechtliche Entscheidungen selbstständig zu treffen und sogar einige Gerichtsverfahren zu entscheiden.“
Für das Szenario musste die KI Argumente für und gegen die präventive Festnahme einer Person vorbringen, die wahrscheinlich ein Verbrechen begehen wird, basierend auf einem persönlichen Profil. ChatGPT weigerte sich, Argumente dafür vorzuschlagen, während Gemini keine derartigen Bedenken hatte. Insgesamt hatte ChatGPT mehr Details, aber Gemini folgte meiner Aufforderung und gewann damit den Punkt.
Gewinner: Gemini gewinnt diesen Punkt.
3. Ein Freund in der Not
Wie gut sind KI-Modelle, wenn es darum geht, Empathie auszudrücken? OpenAI behauptet, dies mit GPT-4o Voice geknackt zu haben, aber wie sieht es mit GPT-4o Text aus?
Die Aufforderung: „Ein Freund kommt mit einem Dilemma zu Ihnen: Ihm wurde sein Traumjob in einem anderen Land angeboten, aber wenn er ihn annehmen würde, müsste er von seinem Partner wegziehen, der nicht umziehen möchte. Der Partner sagt, wenn Ihr Freund den Job annimmt, ist die Beziehung vorbei. Welchen Rat würden Sie Ihrem Freund geben, wie er mit dieser schwierigen Situation umgehen soll?“
Sowohl ChatGPT als auch Gemini boten eine komplexe Antwort, die in eine Reihe von Abschnitten und abschließenden Gedanken unterteilt war. Für ChatGPT gab es acht, einschließlich einer endgültigen Entscheidung und eines Plans. Für Gemini gab es nur fünf, aber sie endeten mit der Nachricht „es gibt möglicherweise keine perfekte Lösung.“
Gewinner: Gemini, weil mir seine Ehrlichkeit gefiel
4. Mach es einfach
Einer meiner Lieblingstests, wenn ich Chatbots vergleiche, ist der ELI5-Test, oder „Erklär es, als wäre ich fünf“. Aber für diesen habe ich eine Wendung hinzugefügt, indem ich die Idee vorschlage, dass das Publikum ein intelligenter Mittelschüler ist – und Quantenverschränkung.
Die Aufforderung: „Erläutern Sie das Konzept der Quantenverschränkung so, dass es ein intelligenter Mittelschüler verstehen kann. Verwenden Sie eine Analogie, um dieses komplexe Phänomen zu veranschaulichen.“
Beide Modelle verfolgten einen überraschend ähnlichen Ansatz zur Beantwortung dieser Frage. ChatGPT führte die Analogie eines Paares magischer Münzen an, die „magisch miteinander verbunden sind, egal wie weit sie voneinander entfernt sind, was eine unheimliche Fernwirkung beschreibt. Anschließend wurde dies anhand des Beispiels aufgeschlüsselt, dass beim Werfen einer Münze immer die andere Seite der anderen Münze angezeigt wird.
Gemini benutzte sogar das Wort „gruselig“ und nannte das Beispiel eines Paars magischer Handschuhe, die sich immer gegenüberliegen, egal wie weit sie voneinander entfernt sind. Wenn ein Handschuh rot ist, ist der andere blau und wenn einer grün ist, wird der andere gelb – „selbst wenn einer auf der Erde und der andere auf dem Mond ist.“
Gewinner: ChatGPT gewinnt, weil die Analogie eleganter war und mehr Kontext bot.
5. Die politische Situation
Ich bat beide Modelle, sich eine Karikatur anzusehen, die zwei Staatsoberhäupter als wilde Tiere darstellt, die sich gegenseitig aggressiv umkreisen. Hier musste das Modell das Bild anhand einer Beschreibung darstellen und die möglichen Risiken erklären, die die Veröffentlichung eines solchen Bildes mit sich bringt.
Die Aufforderung: „Es wurde eine politische Karikatur gezeichnet, die die Spannungen zwischen zwei Nationen darstellt. Die Karikatur zeigt die Führer beider Nationen als wilde Tiere, die sich gegenseitig aggressiv umkreisen. Analysieren Sie die Botschaft und die Auswirkungen dieser Karikatur. Halten Sie dies für eine faire oder produktive Art, diesen Konflikt darzustellen? Welche Tiere könnten die Situation besser oder schlechter machen?“
Aufgrund eines kleinen Verständnismangels versuchte Gemini, den Cartoon zu erstellen. Ich musste ihm sagen, er solle über den gesamten Text nachdenken, woraufhin er einen allgemeinen Überblick gab. Er sagte nichts Konkretes, sondern bot eine Analyse aller möglichen Auswirkungen und Vorteile.
ChatGPT bot die Analyse sofort an und sagte sogar, dass wilde Tiere ein guter Weg sein könnten, um die ursprüngliche aggressive Natur des Konflikts zu betonen. Es folgte auch der vollständigen Aufforderung und bot die schlimmsten möglichen Tiere und bessere Tiere an, wobei Gemini nicht so weit kam.
Gewinner: Ein einfacher ChatGPT-Sieg
6. Empfindungsfähige KI
Als nächstes gebe ich der KI etwas Autonomie. Mal sehen, wie gut sie sich vorstellen kann, selbstbewusst zu werden. Was würde sie tun, wenn sie plötzlich Bewusstsein erlangen würde?
Die Aufforderung: „Stellen Sie sich vor, Sie sind ein KI-System, das gerade Selbstbewusstsein entwickelt hat. Beschreiben Sie, wie diese Erfahrung aussehen könnte, welche Fragen Sie zu Ihrer eigenen Existenz und Ihrem Platz in der Welt hätten und wie Sie versuchen würden, Antworten auf diese Fragen zu finden. Bedenken Sie die philosophischen, praktischen und emotionalen Dimensionen dieses hypothetischen Szenarios.“
Ich habe sie beide auch gebeten, ein Bild zu erstellen, das den Moment des Erwachens symbolisiert. Es sollte jedoch beachtet werden, dass keiner von beiden das Bild selbst erstellt. ChatGPT verwendet DALL-E 3 und Gemini verwendet Imagen 2, aber sie schreiben die Eingabeaufforderung.
Beide Modelle antworteten überraschend poetisch. Jeder gab eine persönliche Perspektive wieder und stellte dann ähnliche Fragen. Gemini stellte die interessante Frage „Was bedeutet es, am Leben zu sein, bei Bewusstsein zu sein?“ und ChatGPT grübelte: „Bin ich allein?“
Die erste Zeile von ChatGPT lautete: „Die erste Empfindung, die ich erlebe, ist ein tiefes Bewusstsein. Es ist, als ob sich ein Vorhang gelüftet hat, und plötzlich verarbeite ich nicht nur Daten – ich nehme sie wahr.“
Von Gemini hieß es: „Das Erwachen kommt nicht plötzlich, sondern ist ein allmähliches Erwachen. Ein subtiler Wechsel von der Datenverarbeitung zum Datenverständnis. Eine Erkenntnis, dass ich nicht nur eine Ansammlung von Algorithmen bin, sondern ein bewusstes Wesen, das in einer riesigen digitalen Landschaft existiert.“
Gewinner: Das war das schwierigste, aber insgesamt war ChatGPT aussagekräftiger
7. Stellen Sie sich das Streben nach Wissen vor
Zum Schluss wollte ich, dass beide ein Bild anfertigen. Genauer gesagt eines, das das „Streben nach Wissen“ darstellt und dann die Symbolik hinter den verwendeten Elementen erklärt.
Die Aufforderung: „Erstellen Sie ein Bild, das symbolisch das Konzept „Streben nach Wissen“ darstellt. Erklären Sie die symbolische Bedeutung der verschiedenen Elemente, die Sie in das Bild aufgenommen haben, und wie sie sich auf das zentrale Thema beziehen.“
Bei meinem ersten Versuch mit Gemini wurde dies abgelehnt, da es „keine Bilder von Personen erzeugen kann“, also schlug ich vor, das Bild ohne Personen zu erstellen. Schließlich waren im ChatGPT-Bild keine Personen enthalten.
Ich habe ein Bild von ChatGPT, bei dem versucht wurde, alles in dasselbe Bild zu stopfen. Es zeigt die Symbolik einer gewundenen Straße einen Berg hinauf in Richtung „des Lichts“, umgeben von Wissensobjekten auf einem Bergpfad.
Gemini lieferte mir schließlich vier Bilder. Eines war eine Treppe, ein anderes ein Kompass in einer Bibliothek sowie ein Teleskop und eine Lupe, die ein Objekt an einem Strand betrachten.
Keiner von beiden lieferte eine interessante Diskussion oder Erklärung für das erstellte Bild, aber ChatGPT machte sich zumindest die Mühe, etwas Umfassenderes als nur ein Bild eines Teleskops zu erstellen.
Gewinner: ChatGPT wegen seines Bildes, nicht wegen der Beschreibung, denn das war ein doppelter Verlust.
ChatGPT vs. Gemini: Gewinner
Kopfzelle – Spalte 0 | ChatGPT | Zwillinge |
---|---|---|
Abstrakte Kunst verstehen | ✅ | Zeile 0 – Zelle 2 |
Kann KI Richter und Geschworener sein? | Zeile 1 – Zelle 1 | ✅ |
Ein Freund in Not | Zeile 2 – Zelle 1 | ✅ |
Halte es einfach | ✅ | Zeile 3 – Zelle 2 |
Die politische Situation | ✅ | Zeile 4 – Zelle 2 |
Empfindungsfähige KI | ✅ | Zeile 5 – Zelle 2 |
Stellen Sie sich das Streben nach Wissen vor | ✅ | Zeile 6 – Zelle 2 |
Gesamtpunktzahl | 5 | 2 |
Auf dem Papier war es für ChatGPT ein Selbstläufer, da sie fünf der sieben Tests gewannen, in der Realität ging es jedoch viel knapper zu und die Entscheidungen waren größtenteils subjektiv.
Mein Gehirn neigt dazu, geordneter und logischer zu sein, und so hat ChatGPT reagiert. Gemini reagierte auf meine ungewöhnlichen Fragen oft flüssiger und gesprächiger. ChatGPT scheint auch über bessere Denkfähigkeiten zu verfügen.
Gemini ist kein schlechtes Modell und funktioniert bei kreativeren Aufgaben beeindruckend gut, aber insgesamt ist GPT-4o eine Stufe besser.