google chatgpt übertreffen soll“ width=“1500″ height=“1000″/>

Google entwickelt ein neues Modell künstlicher Intelligenz mit fortschrittlichen multimodalen Fähigkeiten. Die Umstellung auf Produktion ist für Herbst geplant.

Es wird erwartet, dass der Wettlauf um KI im September 2023 wieder an Fahrt gewinnt. Nach der Präsentation von Genesis vor Presseverlegern bereitet Google die Vorstellung eines neuen Basismodells vor, das sich von LaMDA, der derzeit hinter Bard eingesetzten Technologie, unterscheidet. Das neue Large Language Model (LLM) wird den Namen Gemini tragen, ein lateinisches Wort für „Zwillinge“. Das Projekt entstand aus der Fusion der Teams Google Brain und DeepMind.

Gemini befindet sich seit mehreren Monaten in der Entwicklung und könnte schon bald der Öffentlichkeit vorgestellt werden. Laut einer Quelle, die dem Projekt nahe steht, weitergegeben von Die InformationGoogle plant, das Modell bis Herbst in Produktion zu bringen. YouTube, Google Book, Google Search, Google Scholar … Für seine Ausbildung hätte Gemini von Googles riesigem Datensatz profitieren können.

Ein durch Verstärkung trainiertes Modell

Seine Fähigkeiten sollen denen von GPT-4 überlegen sein, sagte Demis Hassabis, CEO von DeepMind, wenige Wochen nach der jährlichen Entwicklerkonferenz von Google. Gemini soll über bessere Fähigkeiten als GPT-4 verfügen. Um eine solche Leistung zu erreichen, trainierten Google-Teams das Modell mit ähnlichen Techniken, die bei der Entwicklung von AlphaGo verwendet wurden. Zur Erinnerung: AlphaGo ist das erste Computerprogramm, dem es 2017 gelang, einen menschlichen Spieler im Go-Spiel zu schlagen. Das Programm wurde von DeepMind-Teams entwickelt, als sie noch nicht unter der Führung von Google standen.

Siehe auch  Lehrer nutzen ChatGPT zunehmend – Schüler weniger

Ebenso wie GPT-3 und GPT-4 wurde Gemini von gesteuert Verstärkungslernen. In dieser Phase lernt die KI durch Belohnungen und Strafen, basierend auf den von ihr ausgeführten Aktionen. Dieses Feedback trägt dazu bei, das Verständnis des Modells zu verfeinern, ähnlich wie ein Mensch aus Fehlern und Erfolgen lernt. Diese Methode ist äußerst effektiv, da sie die Entwicklung adaptiver Modelle ermöglicht, die sich an komplexe und vielfältige Aufgaben anpassen können. LaMDAdas Vorgängermodell von Google, wurde durch überwachtes Lernen trainiert.

Ein fortschrittliches multimodales Modell

Laut der Quelle von The Information wäre Gemini mehr als nur ein Sprachmodell, es wäre standardmäßig multimodal. Es wäre möglich, die Eingabe-KI mit Texten, Bildern oder sogar Videos zu versorgen. In den letzten Monaten haben die derzeit in Produktion befindlichen KI-Modelle damit begonnen, Multimodalitätsfunktionen zu implementieren. Allerdings bleibt die Nutzung einfach und erlaubt noch keine Bearbeitung komplexer Aufgaben. Das Modell würde eine große Lücke im Vergleich zu aktuellen multimodalen Modellen darstellen.

Laut dieser Quelle könnte Google Gemini zunächst als Update von Google Bard oder durch die Einführung eines brandneuen Geräts präsentieren Chatbot basierend auf dem Modell, wiederum laut The Information. Die Technologie könnte dann Kunden der Google Cloud Platform angeboten werden, bevor sie über die Suite bereitgestellt wird. Google Workspace. Eine Veröffentlichung von Gemini im Herbst würde Googles Wunsch widerspiegeln, im KI-Rennen zu bleiben. Laut Analysten ist es wahrscheinlich, dass OpenAI zwischen September und Oktober GPT-4.5 vorstellen wird, eine verbesserte Version von GPT-4. Schließlich könnte GPT-5 Ende des Jahres oder, was wahrscheinlicher ist, im ersten Quartal 2024 das Licht der Welt erblicken.

Siehe auch  OpenAI aktualisierte ChatGPT-App für iPad
Anzeige

Kommentieren Sie den Artikel

Bitte geben Sie Ihren Kommentar ein!
Bitte geben Sie hier Ihren Namen ein