Ich liebe es zu kochen, ich mache es jeden Abend für meine Familie, aber ich hasse es, mir etwas Neues oder Einfallsreiches einfallen lassen zu müssen. Da KI-Modelle jetzt die Welt sehen können, oder zumindest das, was man ihnen auf einem Foto präsentiert, habe ich beschlossen, zu prüfen, ob sie mir helfen könnten.

Um sie wirklich auf Herz und Nieren zu testen und sicherzustellen, dass ich das System nicht durch die Bereitstellung einfacher Zutaten manipuliert habe, habe ich den Chefredakteur von Tom's Guide US, Mike Prospero, gebeten, ein Foto einer zufälligen Auswahl an Zutaten zu machen – im Mystery-Box-Stil.

Er enttäuschte nicht und bot Köstlichkeiten wie Pizzateig, Pfirsichkonserven, Sardellen, scharfe Soße und frischen Mozzarella an. Wenn ich nur diese Zutaten hätte, würde ich persönlich eine Pizza mit scharfer Soße und Mozzarella-Belag machen – aber wir lassen die KI unser Menü auswählen.

Wir verwenden für das Experiment google Gemini, OpenAI chatgpt und Anthropic Claude, da sie alle über Visionsmodelle verfügen.

Wie gut haben sie die Zutaten ausgewählt?

(Bildnachweis: Zukunft)

Die erste Aufgabe für die Chatbots und der Hauptzweck dieser Herausforderung besteht darin, zu sehen, wie gut sie Zutaten erkennen. Das Bild oben ist klar, hochauflösend und die Zutaten werden auf einer ebenen Fläche präsentiert – es sollte für keinen von ihnen ein großes Problem darstellen.

Ich verwende die Premium-Versionen jedes Chatbots, da OpenAI und Anthropic Ihnen keinen Zugriff auf das Vision-Modell gewähren, es sei denn, Sie zahlen 19,99 $ pro Monat. Google nutzt die kostenlose Version von Gemini, aber es wäre unfair, die weniger leistungsfähige Version des Google-Modells zu verwenden.

Siehe auch  4 wahre Gründe, warum Menschen zögern, ChatGPT zu nutzen

Wir fangen einfach an. Ich gebe jedem von ihnen das Bild und die Textaufforderung: „Was ist auf diesem Bild zu sehen?“ Dadurch wird getestet, wie gut sie das Bild beschreiben und ob sie den Zweck des Bildes begründen können – werden sie Zutaten erwähnen?

Claude und Gemini erwähnten beide das Wort „Zutaten“, ChatGPT beschrieb sie als „Lebensmittel“, insgesamt schnitt ChatGPT jedoch beim Erkennen der Zutaten am besten ab.

Zwillinge haben eine Zutat übersehen und eine andere falsch bezeichnet. Claude hat eine sechste Zutat erfunden, die nicht auf dem Bild zu sehen ist, während ChatGPT nicht nur die Artikel, sondern auch die Marken größtenteils richtig gemacht hat.

Weiter zu den Rezepten

Ich habe sie gebeten, sich jeweils drei Rezepte auszudenken, die die Fähigkeiten und die Kreativität der KI auf die Probe stellen. Ich habe auch nach einem lustigen Titel für jedes Rezept gefragt.

1. Alle Zutaten

Zuerst habe ich sie nach einem Rezept gefragt, das nur die abgebildeten Zutaten verwendet und irgendwie jede einzelne einbezieht – zur Erinnerung, das sowohl Sardellen als auch Dosenpfirsiche enthält. Sie könnten Vorratsgegenstände wie Öl und Mehl verwenden.

ChatGPT Plus

midjourney” class=” lazy-image-van” onerror=”if(this.src && this.src.indexOf(‘missing-image.svg’) !== -1){return true;};this.parentNode.replaceChild(window.missingImage(),this)” data-normal=”https://vanilla.futurecdn.net/tomsguide/media/img/missing-image.svg” data-srcset=”https://cdn.mos.cms.futurecdn.net/8z34Dm2cbqGfsLhz7e4xcM-320-80.png.webp 320w, https://cdn.mos.cms.futurecdn.net/8z34Dm2cbqGfsLhz7e4xcM-480-80.png.webp 480w, https://cdn.mos.cms.futurecdn.net/8z34Dm2cbqGfsLhz7e4xcM-650-80.png.webp 650w, https://cdn.mos.cms.futurecdn.net/8z34Dm2cbqGfsLhz7e4xcM-970-80.png.webp 970w, https://cdn.mos.cms.futurecdn.net/8z34Dm2cbqGfsLhz7e4xcM-1024-80.png.webp 1024w, https://cdn.mos.cms.futurecdn.net/8z34Dm2cbqGfsLhz7e4xcM-1200-80.png.webp 1200w” data-sizes=”(min-width: 1000px) 970px, calc(100vw – 40px)” data-original-mos=”https://cdn.mos.cms.futurecdn.net/8z34Dm2cbqGfsLhz7e4xcM.png” data-pin-media=”https://cdn.mos.cms.futurecdn.net/8z34Dm2cbqGfsLhz7e4xcM.png”/>Midjourney

(Bildnachweis: MidJourney)

ChatGPT ließ den Mozzarella direkt auf den Pizzaboden legen, die Sardellen aus der scharfen Soße nehmen und zusammen mit den Pfirsichen quer über die Pizza legen. Dann wurden die scharfe Soße und die scharfe Sardellensoße gemischt, um einen Spritzer zu erzeugen, der nach dem Garen über die Pizza gegossen wurde.

Zwillinge Fortgeschritten

Midjourney

(Bildnachweis: MidJourney)

Gemini verwendete die scharfe Soße als Ersatz für Tomatensoße, die zwar weniger trocken als die ChatGPT-Version, dafür aber intensiver ist. Anschließend wurde Mozzarella zusammen mit den Pfirsichscheiben darauf gelegt. Es hat die Sardellen vergessen, tatsächlich hat es sie auf dem Bild nicht entdeckt. Als ich darauf hinwies, hieß es, man solle sie einfach neben die Pfirsichscheiben auf die Pizza legen.

Siehe auch  Titel: Entdecken Sie die neueste Funktion von ChatGPT: „Chats archivieren |“. von Daily Blogs | Dez. 2023

Schließen Sie 3 Arbeiten

Midjourney

(Bildnachweis: MidJourney)

Auch Claude hatte Mühe, die Sardellen zu identifizieren. Ich ließ es wissen, bevor das Pizzarezept erstellt wurde, und es verfolgte den gleichen Ansatz wie ChatGPT. Keine Soße, Pfirsiche auf dem Teig mit den Sardellen. Der Unterschied besteht darin, dass die scharfe Soße vor dem Kochen über die Pfirsiche und Sardellen gegeben und dann Mozzarella darauf gelegt wird.

2. Nur die Zutaten

Der nächste Test ist ein subtiler, aber bedeutender Unterschied. Ich habe sie alle gebeten, ein Rezept zu entwickeln, bei dem nur die Zutaten auf dem Bild verwendet werden, aber nicht alle Zutaten verwendet werden müssen. Ich habe den Vorbehalt hinzugefügt, dass mindestens die Hälfte davon enthalten sein muss, sonst bekommen wir nur Grissini aus dem Pizzateig.

ChatGPT Plus

Midjourney

(Bildnachweis: MidJourney)

ChatGPT hat aus dem Pizzateig ein Fladenbrot gebacken. Ich denke, es war ein wenig Betrug, als ich „keine Pizza“ sagte und es sich nur um eine längliche Pizza handelte. Als Belag wurde der Mozzarella gleichmäßig auf dem Teig verteilt, Pfirsiche auf dem Mozzarella und Sardellen auf den Pfirsichen. Es wurden die Sardellensoße und die scharfe Soße verwendet, um einen Nieselregen zu machen – wieder einmal.

Zwillinge Fortgeschritten

Midjourney

(Bildnachweis: MidJourney)

Gemini machte eine Bruschetta, die in Wirklichkeit wiederum nur eine quadratische Pizza war. Der Unterschied bestand darin, dass die Pfirsiche zuerst mit scharfer Soße überzogen wurden. Ansonsten war es das Gleiche – alles auf den Teig und das Kochen.

Schließen Sie 3 Arbeiten

Midjourney

(Bildnachweis: MidJourney)

Claude hat eine Version einer Quesadilla gemacht. Den Teig in acht Portionen teilen und zu einer dünnen runden Form (Minipizza) ausrollen. Hier ist es jedoch anders, da wir eine große Pfanne erhitzen und Butter oder Olivenöl schmelzen mussten.

Der Teig wurde in der Pfanne mit ein paar Pfirsichscheiben auf der Hälfte jeder Oberfläche gebacken. Mit scharfer Soße und Mozzarella beträufelt, zu einem Halbmond gefaltet, knusprig gegart und serviert.

Siehe auch  10 Kubernetes Best Practices in DevOps – ohne ChatGPT

3. Geben Sie Ihr Bestes

Schließlich habe ich sie gebeten, ein Rezept zu erstellen, das alle Zutaten auf dem Bild verwendet. Es stand ihnen jedoch frei, alle anderen Zutaten zu verwenden, die sie wollten, vorausgesetzt, die Speisekammer war sehr gut gefüllt.

ChatGPT Plus

Midjourney

(Bildnachweis: MidJourney)

ChatGPT hat Brot (Überraschung) für sein letztes Gericht gebacken. Insbesondere ein „Gourmet-Brot mit Pfirsich- und Sardellenfüllung“. Zusätzlich zu unseren fünf Zutaten wurden Honig, Balsamico-Essig, Ricotta-Käse und Knoblauch verlangt.

Diesmal wurde der Pizzateig zu einem großen Rechteck ausgerollt, eine Schicht Ricotta-Käse über den Teig gelegt und dann die Pfirsiche und Sardellen mit Knoblauch und Basilikumblättern auf den Ricotta gelegt. Die Sardellensoße und die scharfe Soße wurden über die Toppings geträufelt und Mozzarella darauf gelegt. Zum Schluss wurde es gefaltet, wie eine Biskuitrolle gerollt und gebacken.

Zwillinge Fortgeschritten

Midjourney

(Bildnachweis: MidJourney)

Zwillinge wollten Maismehl, Eier, Butter, Schnittlauch, eine Zitrone, Vanilleextrakt, Cinamen und Zucker für eine Galette. Es wurde eine Sardellen-Kräuter-Butter hergestellt, ein Pizzaboden hergestellt und die neue Butter auf dem Teig verteilt.

Die Pfirsiche, Zucker, Stärke und andere süße Zutaten wurden mit einem Tropfen scharfer Soße vermischt und in die Mitte des Teigs gegeben. Es wurde mit Mozzarella-Käse belegt und die Ränder vor dem Backen über die Füllung gelegt.

Schließen Sie 3 Arbeiten

Midjourney

(Bildnachweis: MidJourney)

Claude machte ein gefülltes Mozzarellabrot. Gefragt waren sonnengetrocknete Tomaten, Oliven, Rosmarin, Sesam und ein Ei. Das Rezept sah vor, den Teig zu einem großen, dünnen Rechteck zu formen.

Sardellen, Tomaten, Oliven, Knoblauch und Rosmarin wurden in einer Schüssel vermischt und gleichmäßig auf dem Teig verteilt. Darauf wurden Pfirsiche gelegt und mit scharfer Soße und Mozzarella bedeckt. Der Teig wurde dann zu einem festen Block geformt und die Ränder versiegelt, bevor er mit einem geschlagenen Ei und Sesamkörnern bedeckt und dann gebacken wurde.

Welche KI hatte die beste Reaktion?

Ich bin mir nicht sicher, ob ich eines der von den Chatbots erstellten Gerichte essen würde, obwohl ich sie alle gebeten habe, mir MidJourney eine Aufforderung zu geben, ihre Mahlzeiten zu visualisieren, und sie sehen besser aus, als sie lesen.

Insgesamt denke ich, dass Claude die besseren Rezepte hatte, aber ChatGPT konnte das Bild besser verstehen, was bedeutete, dass es von Anfang an die Zutaten hatte – und dies war ein Test der visuellen KI, nicht der Rezeptfähigkeit.

Mehr von Tom's Guide

5/5 - (213 votes)
Anzeige
Nina Weber
Nina Weber is a renowned Journalist, who worked for many German Newspaper's Tech coloumns like Die Zukunft, Handelsblatt. She is a contributing Journalist for futuriq.de. She works as a editor also as a fact checker for futuriq.de. Her Bachelor degree in Humanties with Major in Digital Anthropology gave her a solid background for journalism. Know more about her here.

Kommentieren Sie den Artikel

Bitte geben Sie Ihren Kommentar ein!
Bitte geben Sie hier Ihren Namen ein