- Dario Brooks
- BBC News World
Google hat den Wettlauf um die Entwicklung von Chatbots mit künstlicher Intelligenz (KI) langsamer begonnen als der Konkurrent OpenAI, aber die Lücke schließt sich.
Der Technologieriese brachte am 10. Mai Bard auf den Markt, eine aktualisierte Version seiner Plattform, mit dem Ziel, Benutzern die gleichen oder sogar bessere Funktionen als chatgpt zu bieten.
Die Unterschiede zwischen den beiden Systemen sind immer noch bemerkenswert, Experten gehen jedoch davon aus, dass sich das Rennen stabilisiert.
Lesen Sie auch auf BBC Africa:
„Im Moment hat ChatGPT-4 einen klaren Vorteil. Bard tritt als Herausforderer und nicht als Anführer auf“, sagte Ricardo Carreon, Chief Technology Officer bei Hexabit, einem KI-Unternehmen mit Sitz in Texas (USA).
„Aber es wird zusammenkommen und es wird einen echten Wettbewerb zwischen den Plattformen geben. Die Frage wird sein, wie sich die Nutzerbasis auf beiden Plattformen entwickeln wird. Letztendlich besteht die Herausforderung darin, wer die meisten Nutzer haben wird“, sagte Carreon gegenüber BBC Mundo.
Eine der größten Einschränkungen von Bard besteht darin, dass nur Anweisungen in Englisch, Japanisch und Koreanisch akzeptiert werden. Bis heute ist die versprochene Unterstützung von über 40 Sprachen für die neue Version noch nicht erfolgt.
„Während wir Bard weiterhin verantwortungsvoll wachsen lassen, erweitern wir schrittweise den Zugang zu weiteren Ländern und Regionen auf Englisch. Wir werden im Laufe der Zeit weiter expandieren“, sagte eine Google-Quelle gegenüber BBC World, ohne ein Datum anzugeben.
Andererseits besteht einer der Vorteile von Bard gegenüber ChatGPT darin, dass es sich bei letzterer um eine kostenpflichtige Version (20 US-Dollar) handelt, während die Nutzung des Chatbots von Google kostenlos ist.
Abgesehen davon, wie nah oder weit sind die neuen Funktionen von Bard an ChatGPT-4?
1. Bilder in Bard
Vor einigen Monaten beschränkte sich die Interaktion mit Google- und OpenAI-Chatbots auf Text.
In einer Zeit, in der das Internet Bilder bevorzugt, schien dies nicht angemessen. Aber OpenAI hat die Barriere durchbrochen, indem es im März ChatGPT mit der Integration von Bildern in seinen Chatbot einführte.
Bard hat diese Funktionalität nun in seine neue Version übernommen, wodurch es das Tempo des Wettbewerbs beschleunigen kann.
Die grundlegendste Funktion besteht darin, Anweisungen basierend auf einem Bild zu erhalten. Sie können ihn beispielsweise fragen, wo sich das Kunstwerk befindet, das jemand auf Instagram geteilt hat, ohne die Quelle zu nennen.
Zum anderen gibt es das Angebot bildbasierter Antworten. Sie können ihn beispielsweise bitten, Ihnen Fotos der meistbesuchten Gemälde im Louvre-Museum in Paris zu zeigen, und Sie erhalten in wenigen Sekunden die Antwort mit einem Text und Fotos.
Doch die KI-Innovation geht noch weiter. „Es geht nicht nur darum, ein Foto zu suchen, sondern auch zu lesen, was darin enthalten ist, und darauf basierend eine bestimmte Aktion auszuführen“, sagt Carreon.
„Wenn ich Eier, Tomaten und Zwiebeln auf dem Tisch habe und ihn frage, was ich tun kann, kann er mir Eier nach mexikanischer Art vorschlagen und mir das Rezept mit diesen Zutaten zeigen. Dann erkennt er, was das auf dem Bild ist, und geht über das Finden hinaus.“ ähnliche Bilder. Es versteht, was darin enthalten ist.
Diese Fähigkeit wird als „multimodale Funktionalität“ bezeichnet: Anstatt dem Chatbot Anweisungen nur in Form von Text zu geben, ist er in der Lage, auch Bilder zu verstehen.
Ein weiteres Feature, das noch nicht verfügbar, aber angekündigt ist, ist die KI-Bildgenerierung von Adobe. Wenn es gestartet wird, können Sie es auffordern, ein Bild mit der Kombination von Elementen zu erstellen, die Sie ihm angeben.
Ein Bild Ihres Haustieres mit einer Geburtstagsmütze? Das können Sie von ihm verlangen.
Google gibt an, noch mit dieser Möglichkeit zu experimentieren. „Wir wollen es schrittweise und verantwortungsvoll umsetzen“, sagte Ricardo Carreon.
Dies wäre ein großer Fortschritt gegenüber ChatGPT, das keine Pläne für eine ähnliche Funktion enthüllte.
2. Integration mit anderen Diensten
Die von KI-Chatbots bereitgestellten Informationen zu haben, ist ein erster Schritt, aber wie geht es weiter?
In der neuen Bard-Version bietet Google nun eine direkte „Ausgabe“ dieser Informationen an seine Cloud-Dienste an.
Warum gibt künstliche Intelligenz so viel Anlass zur Sorge?
Sie können Inhalte direkt an Ihr Gmail-Postfach senden, wenn Sie es bitten, einen Urlaubsantrag für Ihren Chef zu schreiben. Oder an den Docs-Dienst, wenn Sie ihn bitten, ein Lied für Ihren Vater zu komponieren.
Der Chatbot von OpenAI bietet lediglich einen Button zum Kopieren der Inhalte in die Zwischenablage.
„Schließlich kämpft die Welt von Google mit ChatGPT-4 gegen die Welt von Microsoft. Er hat bereits angekündigt, dass er der Co-Pilot in E-Mails, in Office, für Programmierer auf GitHub sein wird, er wird Ihr Co-Pilot sein.“ sogar unter Windows“, warnt Herr Carreon.
„In bestimmten Funktionen von Windows können Sie daher einen Assistenten mit künstlicher Intelligenz nutzen, um bestimmte Aufgaben innerhalb des Betriebssystems auszuführen“, fügt er hinzu.
Was von der KI-Branche wirklich erwartet wird, ist nicht nur die Entwicklung von Chatbots, sondern die Anpassung dieser enormen Informationsverarbeitungs- und Lernkapazität an andere alltägliche oder spezialisierte Anwendungen.
„Mit einer Restaurant-Reservierungs-App können Sie ihm durch die Integration von Intelligenz bereits im Chat sagen, dass er ein Lokal empfehlen soll, das vegan ist und abends bis 00:00 Uhr geöffnet ist. Die App gibt Ihnen die Liste und Sie sagen ihm, wo Sie sind.“ „Ich möchte buchen“, erklärt Herr Carreon.
3. Beispiele für Informationsquellen
Google und einige Experten haben die verbesserten mathematischen Denk- oder Programmierfähigkeiten in mehr als 20 Programmiersprachen hervorgehoben, die die neue Version von Bard bietet.
Dies wird jedoch nur von Fachleuten in diesen Bereichen wahrgenommen.
Eine der zusätzlichen Funktionen von Bard, die für die regelmäßige Verwendung durch Benutzer hervorgehoben wurde, ist jedoch die Quelleneintragung, die der Chatbot von Google bereits jetzt durchführt.
Die KI war besorgt über die „Halluzinationen“, die diese Chatbots hervorrufen können. Dies ist die Bezeichnung für die falschen, ungenauen oder unvollständigen Informationen, die sie aus ihren riesigen Datenbanken generieren, und für ihre eigene Fähigkeit, diese auf der Grundlage von Lernen zu produzieren.
Bard zeigt jetzt die verschiedenen Quellen an, aus denen es Informationen abgerufen hat, was bei ChatGPT nicht der Fall ist. Dies trägt dazu bei, Vertrauen in die Ergebnisse aufzubauen, die überprüft werden können.
Für Herrn Carreon sind diese Informationen wertvoll, er mahnt jedoch zur Vorsicht und kritischen Beurteilung dessen, was der Chatbot präsentiert.
„Die KI greift auf Informationen aus ihrem Datenpool zu. Es stimmt aber auch, dass sie Informationen generiert, weil das Modell lernt. Es wird Informationen geben, die nicht von einem bestimmten Ort stammen“, erklärt er.
„Wenn er bereits gelernt hat, dass es für ein Problem eine gute Lösung gibt, wird er Ihnen nicht unbedingt Links geben.“ Da diese Programme jedoch immer noch Fehler enthalten, ist es sehr wichtig, dass alle Personen, die KI verwenden, das Endergebnis überprüfen, da es manchmal zu Fehlern kommt.
Für den Hexabit-Experten müssen Nutzer verstehen, dass KI nicht nur eine Suchmaschine für Informationen ist.
Das Ziel der Entwickler bestand darin, ein Tool zu entwickeln, das menschliches Lernen und Denken nachahmen kann.
„Wie Bill Gates sagt, stirbt die Suche, wie wir sie heute kennen, aus. Das hat enorme Auswirkungen, nicht nur für Google, sondern für alle Content-Publisher, die Google als primäre Traffic-Plattform nutzen.“, erklärt er.
„Ich glaube, vielen Menschen ist noch nicht klar, dass es alles verändern wird, aber auf brutale Weise. Und es passiert bereits, es ändert sich bereits eine Menge.“