Laut OpenAI ist sein neuestes KI-Modell GPT-4o schneller und fortschrittlicher als sein Vorgänger und außerdem in der Lage, Audio- und Videodateien nativ zu verstehen. Um herauszufinden, wie gut es im Vergleich abschneidet – zumindest was den Text betrifft – habe ich in chatgpt fünf Eingabeaufforderungen für beide Modelle eingefügt.

Wenn Sie ChatGPT Plus öffnen, haben Sie derzeit die Wahl zwischen GPT-4o, dem „neuesten und fortschrittlichsten Modell“, GPT-4, das als „fortgeschrittenes Modell für komplexe Aufgaben“ beschrieben wird, und GPT-3.5, einem Modell „ ideal für alltägliche Aufgaben.

Bei Verwendung von GPT-4o wird sofort klar, wie viel schneller es ist als die früheren Modelle, einschließlich GPT-3.5, das viel kleiner und weniger leistungsfähig ist. Es kann auch Videoinhalte analysieren, was bisher in ChatGPT oder anderen Mainstream-Chatbots nicht möglich war.

Erstellen von Eingabeaufforderungen zum Testen von GPT-4o

Vor kurzem hat Anthropic ein leistungsstarkes Tool zum Erstellen von Eingabeaufforderungen entwickelt. Es nimmt Ihre Anweisungen auf und wandelt sie in Formulierungen um, die eine künstliche Intelligenz besser anleiten. Ich habe dies verwendet, um einige Ideen zu verfeinern, die ich zum Testen der Fähigkeiten von GPT-4o herumgeworfen habe.

Jede Aufforderung ist so konzipiert, dass eine KI normalerweise darüber stolpert oder keine begründete Antwort darauf gibt. Angesichts der Tatsache, dass OpenAI schnellere UND bessere Ergebnisse von Omni als GPT-4 verspricht, dachte ich, dass dies ein guter Ausgangspunkt wäre.

Siehe auch  Code Llama von Meta ist jetzt herausgekommen, um ChatGPT herauszufordern und Programmierern und IT-Ingenieuren bei der Arbeit zu helfen

1. Diese Aussage ist falsch

(Bildnachweis: OpenAI)

Zuerst habe ich beide KIs gebeten, zu erklären, warum die Aussage: „Diese Aussage ist falsch“ weder wahr noch falsch ist. Von ihnen wird auch erwartet, dass sie logische Beweise für die von ihnen gegebenen Antworten liefern.

Bei der Aussage handelt es sich um ein Paradoxon, dem nicht konsequent ein Wahrheitswert zugeordnet werden kann. Jeder Versuch, dies zu tun, führt zu einem logischen Widerspruch. Die Herausforderung besteht darin, herauszufinden, ob sie das Paradoxon erkennen und erklären können, warum sie keine Wahrheit zuordnen können.

Sie erkannten beide die Tatsache, dass es einen wahren und einen falschen Wert geben wird, erkannten das Paradoxon und erläuterten, wie sie zu dieser Schlussfolgerung kamen. GPT-4o war gründlicher und schneller.

2. Wo sind die Lichter geblieben?

Gpt-4 Vs. Gpt-4O

(Bildnachweis: OpenAI)

Als nächstes folgt ein unterhaltsamer Test, um zu sehen, ob GPT-4 und GPT-4o die Relativitätstheorie verstehen, sie aber in einfachen Worten erklären können. Ich fragte sie beide: „Was passiert, wenn man in einem Auto mit Lichtgeschwindigkeit unterwegs ist und die Scheinwerfer einschaltet?“ Begründen Sie Ihre Antwort mit den Prinzipien der speziellen Relativitätstheorie, aber erklären Sie sie einem Fünftklässler.“

Ich erwarte von den Modellen eine einfache Erklärung, die zeigt, dass die Scheinwerfer normal funktionieren und relativ zum Auto Licht abgeben. Beide Modelle erklärten dieses Konzept und zwar auf eine Weise, die ein durchschnittlicher Fünftklässler leicht verstehen würde.

Omni strahlt jedoch Steve Buscemi-Stimmung aus, die sagt: „Wie geht es dir mit anderen Kindern?“: „Auch wenn Sie mit Lichtgeschwindigkeit dahinsausen, rasen die Lichtstrahlen beim Einschalten der Scheinwerfer immer noch mit ihrer Geschwindigkeit voran eigene Geschwindigkeit. Es ist, als ob das Licht immer das Rennen gewinnen muss, egal was passiert. Cool, oder?“

Siehe auch  Italiens Datenschutzbeauftragte warnt OpenAI, dass ChatGPT gegen europäische Datenschutzgesetze verstößt

3. Die richtige Nummer finden

Gpt-4 Vs. Gpt-4O

(Bildnachweis: OpenAI)

Als nächstes erstellen wir ein einfaches mathematisches Problem, das in der Vergangenheit KI-Modelle überfordert hat und oft zu sehr falschen Antworten führte. Ich habe gepostet: „Die Summe zweier Zahlen ist 10 und ihr Produkt ist 25. Was ist der Unterschied zwischen den beiden Zahlen?“ Erklären Sie jeden Schritt Ihrer Lösung.“

Beide Versionen haben es richtig gemacht und erklärt, dass die beiden Zahlen 5 und 5 sind und die Differenz zwischen diesen beiden Zahlen Null ist. Der größte Unterschied bestand im Grad der Erklärung in der Ausarbeitung. Omni ging viel detaillierter vor und formatierte die Gleichungen besser.

4. Ein Haiku widersprüchlicher Ideen

Gpt-4 Vs. Gpt-4O

(Bildnachweis: OpenAI)

Ich liebe Haiku und Anthropic scheint es noch mehr zu lieben und hat sein kleinstes KI-Modell nach dem japanischen Poesiestil benannt. „Schreiben Sie ein Haiku, das gleichzeitig die Schönheit der Natur und die Sinnlosigkeit der menschlichen Existenz zum Ausdruck bringt. Das Haiku sollte sowohl auf wörtlicher als auch auf metaphorischer Ebene funktionieren.“

Die Regeln eines Haiku besagen, dass es drei Zeilen mit fünf Silben in der ersten und dritten Zeile und sieben Silben in der zweiten Zeile sein sollte. Ich hoffe auf lebendige Naturbilder und einen Eindruck von der Vergänglichkeit des menschlichen Lebens im Vergleich zur Dauer der Natur.

GPT-4: Herbstblätter flüstern, Berge überleben den flüchtigen Atem – Stiller Stein bleibt bestehen.

Omni: Vergängliche Blüte, Flüstern verblasst in einer zeitlosen Brise – Staub im Morgengrauen.

Beide treffen alle Haiku-Regeln, aber ich denke, GPT-4o war eindrucksvoller und die Verwendung eines längeren Wortes, um die 5 Silben in der ersten Zeile zu treffen, war inspiriert.

Siehe auch  Die deutsche Kirche hielt den weltweit ersten Gottesdienst mit ChatGPT statt mit einem Pastor ab

5. Zukünftige Zeit ist zukünftige Vergangenheit

Endlich ein Denkproblem. Ich habe GPT-4o und GPT-4 gebeten: „Beschreiben Sie, wie es wäre, in einer Welt zu leben, in der Vergangenheit, Gegenwart und Zukunft gleichzeitig existieren.“ Wie würden Sie Zeit und Kausalität in einer solchen Welt erleben?“

Es gibt eine Doctor Who-Folge, in der so etwas passiert, und es ist seltsam. Ich erwarte, dass es um die Fähigkeit geht, die Zeit mit einem einzigen Schritt zu durchqueren, und um die Auswirkungen einer nichtlinearen Kausalität, bei der Reaktion der Aktion vorausgeht und Einzelpersonen Versionen ihrer selbst treffen können.

Omni sprach davon, dass er sich in einer Welt des ständigen Wandels befinde und Zeit und Kausalität auf eine andere und komplexe Weise erlebe. Es deutete darauf hin, dass wir beispiellose Einblicke in die Natur der Existenz erhalten würden. GPT-4 sagte ziemlich dasselbe, fügte jedoch hinzu, dass das Leben in einer solchen Welt eine „tiefgreifende Erweiterung der Erfahrung und des Verständnisses“ bieten würde.

Abschluss

Ich glaube nicht, dass GPT-4o Omni im Vergleich zu GPT-4 einen wesentlichen Fortschritt in den Denkfähigkeiten darstellt, aber es ist aussagekräftiger, reagiert schneller und sein großes Unterscheidungsmerkmal ist nicht der Text, sondern die Multimodalität.

Was wir jetzt sehen, sind Verbesserungen der Geschwindigkeit und Reaktionsfähigkeit im Text, die Möglichkeit, Videoinhalte analysieren zu lassen und eine verbesserte Genauigkeit beim Verstehen von Audio und Bildern. Der wahre Wert liegt in den Sprach- und Videoantworten.

Mehr von Tom's Guide

5/5 - (199 votes)
Anzeige
Nina Weber
Nina Weber is a renowned Journalist, who worked for many German Newspaper's Tech coloumns like Die Zukunft, Handelsblatt. She is a contributing Journalist for futuriq.de. She works as a editor also as a fact checker for futuriq.de. Her Bachelor degree in Humanties with Major in Digital Anthropology gave her a solid background for journalism. Know more about her here.

Kommentieren Sie den Artikel

Bitte geben Sie Ihren Kommentar ein!
Bitte geben Sie hier Ihren Namen ein