Der Start von chatgpt im vergangenen November erschütterte google in seinen Grundfesten. Der beliebte Chatbot stellte eine solche Bedrohung für das Geschäft des Unternehmens dar, dass es eine Erklärung abgeben musste Alarmstufe Rot und begann zu investieren, um auf den Zug der generativen KI aufzuschließen. Diese Bemühungen führten nicht nur zur Veröffentlichung von Google Bard, sondern auch von Gemini.
Was ist Google Gemini?
Gemini ist eine Reihe großer Sprachmodelle (LLMs), die GPT-4 mit Trainingstechniken aus GPT-4 kombinieren AlphaGoB. Reinforcement Learning und Tree Search, die das Potenzial haben, ChatGPT als dominanteste generative KI-Lösung auf dem Planeten zu verdrängen.
Die Nachricht kommt nur wenige Monate, nachdem Google seine KI-Labore Brain und DeepMind zusammengelegt hat ein neues Forschungsteam namens Google DeepMind gründenund nur wenige Monate nach der Einführung von Bard und seinem PaLM 2 LLM der nächsten Generation.
Forscher gehen davon aus, dass die generative KI Da der Markt bis 2032 schätzungsweise 1,3 Billionen US-Dollar wert sein wird, ist klar, dass Google mit Hochdruck in diesen Bereich investieren wird, um seine führende Position in der KI-Entwicklung zu behaupten.
Alles, was wir bisher über Zwillinge wissen
Während viele davon ausgehen, dass Google Gemini im Herbst 2023 erscheinen wird, ist nicht viel über die Fähigkeiten des Modells bekannt.
Bereits im Mai sagte Sundar Pichai, CEO von Google und Alphabet, hat einen Blogbeitrag mit einem allgemeinen Blick auf das LLM veröffentlichterklärend:
„Gemini wurde von Grund auf multimodal, hocheffizient bei Tool- und API-Integrationen entwickelt und ist darauf ausgelegt, zukünftige Innovationen wie Speicher und Planung zu ermöglichen.“
Pichai bemerkte außerdem: „Obwohl wir noch am Anfang stehen, sehen wir bereits beeindruckende multimodale Fähigkeiten, die in früheren Modellen nicht zu finden waren.“
„Sobald Gemini fein abgestimmt und rigoros auf Sicherheit getestet wurde, wird es in verschiedenen Größen und Funktionen erhältlich sein, genau wie PaLM 2.“
Seitdem wurde offiziell nicht viel über die Veröffentlichung gesagt, außer Demis Hassabis, CEO von Google DeepMind, in einem Interview mit Wired, in dem er feststellte, dass Gemini „einige der Stärken von Systemen vom Typ AlphaGo mit dem kombinieren wird erstaunliche Sprachfähigkeiten der großen Modelle.“
Android Police hat außerdem behauptet, dass eine anonyme Quelle, die mit dem Produkt zu tun hat, kommentiert hat, dass Gemini in der Lage sein wird, Text und kontextbezogene Bilder zu generieren werden anhand von Quellen wie YouTube-Videotranskripten geschult.
Werden Zwillinge die Krone von ChatGPT übernehmen?
Eine der größten Diskussionen rund um die Veröffentlichung von Gemini ist die Frage, ob das Mystery-Sprachmodell das Zeug dazu hat, ChatGPT zu verdrängen, das in diesem Jahr eingeführt wird erreichte über 100 Millionen monatlich aktive Nutzer.
Auf den ersten Blick verschafft Geminis Fähigkeit, Text und Bilder zu generieren, einen erheblichen Vorteil gegenüber GPT4 in Bezug auf die Bandbreite der Inhalte, die es produzieren kann.
Das vielleicht bedrohlichste Unterscheidungsmerkmal zwischen den beiden ist jedoch die große Auswahl an proprietären Trainingsdaten von Google. Google Gemini kann Daten verarbeiten, die dienstübergreifend erfasst werden, darunter die Google-Suche, YouTube, Google Books und Google Scholar.
Die Verwendung dieser proprietären Daten beim Training der Gemini-Modelle könnte zu einem deutlichen Fortschritt in der Ausgereiftheit der Erkenntnisse und Schlussfolgerungen führen, die aus einem Datensatz gewonnen werden können. Dies gilt insbesondere dann, wenn dies frühzeitig gemeldet wird Gemini wird auf doppelt so vielen Token trainiert wie GPT4 sind richtig.
Darüber hinaus ist die Partnerschaft zwischen den Google DeepMind- und Brain-Teams in diesem Jahr nicht zu unterschätzen, da sie OpenAI gegen ein Team erstklassiger KI-Forscher antreten lässt, darunter Google-Mitbegründer Sergey Brin und DeepMind Senior AI Wissenschaftler und Experte für maschinelles Lernen Paul Barham.
Hierbei handelt es sich um ein erfahrenes Team, das über ein tiefes Verständnis für die Anwendung von Techniken wie Reinforcement Learning und Baumsuche verfügt, um KI-Programme zu erstellen, die Feedback sammeln und ihre Problemlösung im Laufe der Zeit verbessern können. Dies nutzte das DeepMind-Team, um AlphaGo beizubringen, einen Go zu besiegen Weltmeister 2016.
Das KI-Wettrüsten
Die multimodalen Fähigkeiten von Gemini, der Einsatz von Reinforcement Parenting, Text- und Bildgenerierungsfunktionen und die proprietären Daten von Google sind alles Zutaten, die Gemini braucht, um GPT-4 zu übertreffen.
Die Trainingsdaten sind das Hauptunterscheidungsmerkmal, denn schließlich wird die Organisation, die das LLM-Wettrüsten gewinnt, größtenteils danach entschieden, wer seine Modelle anhand des größten und reichhaltigsten Datensatzes trainiert.
Die Frage ist nun: Was wird OpenAI tun, um darauf zu reagieren?