DeepMind ist seit zehn Jahren ein Pionier in der KI-Forschung. Das in London, Großbritannien, ansässige Unternehmen verfügt über eine nachgewiesene Erfolgsbilanz mit Systemen wie AlphaCode, AlphaGo und AlphaFold. Das AlphaGo-KI-System von DeepMind an die Russen das Kunststück, Lee Sedol, einen der besten Go-Spieler der Welt, zu besiegen. Das Unternehmen wurde von Alphabet übernommen, der Muttergesellschaft von Google, dem Suchriesen und DeepMind, die in den letzten Jahren enge Beziehungen pflegten. Nach KI-Systemen für das Go-Spiel (AlphaGo) und Programmierung (AlphaCode) hat DeepMind angekündigt, dass es sich nun auf den Einstieg in den Chatbot-Markt vorbereitet.
Gemini ist ein großes Textverarbeitungs-Sprachmodell, das GPT-4 ähnelt, der Technologie, die ChatGPT antreibt. Aber Hassabis sagt, sein Team werde diese Technologie mit Techniken kombinieren, die in AlphaGo verwendet werden. das Programm, das 2016 einen Go-Game-Champion besiegte. Ziel ist es, das System mit neuen Fähigkeiten wie Planung oder Problemlösung auszustatten.
Auf hoher Ebene kann man sich Gemini als eine Kombination einiger Stärken von AlphaGo-ähnlichen Systemen mit den unglaublichen Sprachfähigkeiten großer Modelle vorstellen“, erklärt Hassabis. Wir haben auch einige neue Innovationen, die sehr interessant sein werden.
Gemini wurde letzten Monat erstmals auf der Entwicklerkonferenz von Google vorgestellt, als das Unternehmen eine Reihe neuer KI-Projekte ankündigte. AlphaGo basierte auf einer von DeepMind perfektionierten Technik namens Reinforcement Learning, bei der Software lernt, schwierige Probleme zu lösen, die die Auswahl von Aktionen erfordern, wie in Go oder Videospielen, indem sie wiederholte Versuche unternimmt und Feedback zu ihrer Leistung erhält. Er verwendete auch eine Methode namens Baumsuche, um mögliche Züge auf dem Brett zu erkunden und sich einzuprägen.
Der nächste große Schritt für Sprachmodelle könnte darin bestehen, mehr Arbeit im Internet und auf Computern zu leisten. Gemini befindet sich noch in der Entwicklung, ein Prozess, der laut Hassabis mehrere Monate dauern wird. Es könnte Dutzende oder Hunderte Millionen Dollar kosten. Sam Altman, CEO von OpenAI, sagte im April, dass die Entwicklung von GPT-4 mehr als 100 Millionen US-Dollar gekostet habe.
Aufholen
Wenn Gemini fertiggestellt ist, könnte es eine wichtige Rolle bei der Reaktion von Google auf die Wettbewerbsbedrohung durch ChatGPT und andere generative KI-Technologien spielen. Das Forschungsunternehmen hat bei vielen Techniken Pionierarbeit geleistet, die den jüngsten Strom neuer Ideen in der KI ermöglicht haben, hat sich jedoch mit Vorsicht dafür entschieden, darauf basierende Produkte zu entwickeln und einzusetzen. Seit der Einführung von ChatGPT hat Google schnell seinen eigenen Chatbot Bard veröffentlicht und generative KI in seine Suchmaschine und viele andere Produkte integriert.
Um die KI-Forschung voranzutreiben, fusionierte das Unternehmen im April die DeepMind-Einheit von Hassabis mit Googles wichtigstem KI-Labor Brain, um Google DeepMind zu schaffen. Hassabis sagt, dass das neue Team zwei Schwergewichte zusammenbringen wird, die den Grundstein für die jüngsten Fortschritte in der KI gelegt haben.
Blick nach vorn: Die Kraft der Zwillinge freisetzen
Um ein anspruchsvolles Sprachmodell wie Gemini zu trainieren, müssen der Software für maschinelles Lernen große Mengen sorgfältig ausgewählter Texte zugeführt werden. Hassabis erklärt, dass sein Team Daten aus verschiedenen und unterschiedlichen Quellen nutzt, etwa Büchern, Artikeln, Blogs, sozialen Netzwerken oder Online-Gesprächen. Es legt fest, dass die Daten gefiltert werden, um unangemessene oder voreingenommene Inhalte zu entfernen.
Eine der größten Herausforderungen für DeepMind besteht darin, sicherzustellen, dass Gemini die ethischen Standards und Grundsätze von Google für verantwortungsvolle KI einhält. Hassabis sagt, sein Team arbeite eng mit Ethik- und Politikexperten bei Google zusammen, um sicherzustellen, dass das System sicher, zuverlässig und vorteilhaft für die Gesellschaft sei.
„Wir wollen sicherstellen, dass Zwillinge ein nützliches und positives Werkzeug für die Menschen sind“, sagt er. Wir möchten, dass es in der Lage ist, Fragen zu beantworten, Informationen bereitzustellen, kreative Inhalte zu generieren oder Benutzer zu unterhalten.
Hassabis sieht den Einsatz von Gemini in verschiedenen Bereichen wie Bildung, Gesundheitswesen, Unterhaltung oder Wirtschaft. Er hofft, dass das System Menschen dabei helfen kann, neue Dinge zu lernen, Probleme zu lösen, ihrer Kreativität Ausdruck zu verleihen oder mit anderen in Kontakt zu treten.
„Wir glauben, dass Zwillinge das Potenzial haben, die Art und Weise zu verändern, wie Menschen mit der KI und der Welt interagieren“, sagt er. Wir freuen uns darauf, unsere Fortschritte mit der Öffentlichkeit zu teilen und ihr Feedback zu erhalten.
Ein großer Konkurrent für ChatGPT?
Gemini ist nicht das einzige Sprachmodell, das mit ChatGPT konkurrieren will. Auch andere große Player im Bereich KI wie Facebook, Microsoft oder Amazon arbeiten an eigenen Systemen. Hassabis räumt ein, dass die Konkurrenz hart ist, sagt aber, dass DeepMind einen einzigartigen Vorteil hat: seine Erfahrung und sein Fachwissen im Bereich Reinforcement Learning und Baumsuche.
Wir glauben, dass diese Techniken für den Aufbau von KI-Systemen unerlässlich sind, die komplexe Probleme begründen, planen und lösen können“, sagt er. Wir glauben, dass Gemini das erste Sprachmodell sein wird, das diese Fähigkeiten auf effiziente und robuste Weise integriert.
Hassabis ist zuversichtlich, dass Gemini ChatGPT und andere bestehende oder zukünftige Sprachmodelle übertreffen wird. Er behauptet, dass das System in der Lage sein wird, relevantere, konsistentere und vielfältigere Antworten zu generieren als seine Konkurrenten. Er fügt hinzu, dass sich das System auch an die Bedürfnisse und Vorlieben der Benutzer anpassen kann und ihnen ein personalisiertes und ansprechendes Erlebnis bietet.
Wir glauben, dass Gemini das fortschrittlichste und vielseitigste Sprachmodell sein wird, das jemals geschaffen wurde“, sagt er. Wir glauben, dass es den Weg für eine neue Generation generativer KI ebnen wird, die einen positiven Einfluss auf die Welt haben wird.
DeepMind ist nicht sein erster Versuch
Es sollte beachtet werden, dass Gemini nicht DeepMinds erster Ausflug in die Welt der Sprachmodelle ist. Letztes Jahr stellte das Unternehmen Sparrow vor, einen Chatbot, von dem das Labor sagte, dass er weniger wahrscheinlich als andere Sprachmodelle gefährliche oder unangemessene Antworten auf Fragen gibt.
Ersten Tests zufolge liefert Sparrow eine plausible Antwort und untermauert diese in 78 % der Fälle mit Beweisen, wenn ihm eine sachliche Frage gestellt wird: Dennoch ist Sparrow nicht davor gefeit, Fehler zu machen, wie umwerfende Fakten zu machen und manchmal nicht zum Thema gehörende Antworten zu geben , erkennt DeepMind.
Hassabis sagte im Januar, dass DeepMind erwägen würde, Sparrow später in diesem Jahr für die private Beta freizugeben; Es ist unklar, ob diese Pläne noch auf dem richtigen Weg sind.
Gemini ist jedoch DeepMinds bisher ehrgeizigste Arbeit in diesem Segment, zumindest wenn man ersten Berichten Glauben schenken darf. The Information berichtete im März, dass Gemini (das durch die Misserfolge von Bard, dem Chatbot-Projekt von Google, vorangetrieben wurde) direkte Beteiligung von Googles Top-Führungskräften erhält, um mit ChatGPT Schritt zu halten, darunter Jeff Dean, der ranghöchste KI-Forscher des Unternehmens.
Auf dem Weg zu transparenterer Forschung
Da sich die Entwicklung der KI beschleunigt, erkennt Hassabis die damit verbundenen Risiken und Unsicherheiten. Experten für künstliche Intelligenz befürchten, dass die Technologie für böswillige Zwecke missbraucht werden oder schwer zu kontrollieren sein könnte. Einige haben sogar gefordert, die Entwicklung leistungsfähigerer Algorithmen zu stoppen, um die Entstehung potenziell gefährlicher Einheiten zu verhindern.
Hassabis argumentiert jedoch, dass die enormen potenziellen Vorteile der KI, wie etwa Fortschritte in Bereichen wie Gesundheit oder Klimawissenschaft, eine Weiterentwicklung der KI erfordern. Obwohl er die Risiken anerkennt, glaubt er fest an die Weiterentwicklung der KI-Technologie und beschreibt sie als potenziell vorteilhafteste Technologie für die Menschheit, wenn sie richtig entwickelt wird.
DeepMind ist sich der potenziellen Risiken von KI seit seiner Gründung bewusst und verfügt über eine interne KI-Sicherheitsgruppe, die von einem der Mitbegründer des Unternehmens, Shane Legg, geleitet wird. Hassabis schloss sich auch anderen führenden KI-Experten an und warnte in einer Erklärung vor den mit KI verbundenen Risiken, die mit einem Atomkrieg oder einer Pandemie vergleichbar sein könnten.
Eine der unmittelbaren Herausforderungen für Hassabis besteht darin, die wahrscheinlichen Risiken einer besseren KI zu identifizieren. Um die Transparenz zu fördern und die KI-Forschung zu öffnen, schlug Hassabis vor, dass DeepMind der Wissenschaft frühzeitig Zugang zu Grenzmodellen gewähren könnte. Der Schritt würde der wachsenden Befürchtung entgegenwirken, dass Experten außerhalb der Großunternehmen von der neuesten KI-Forschung ausgeschlossen werden.
Während die Bedrohung durch KI weiterhin ungewiss ist, drängt Hassabis angesichts des Tempos der Fortschritte in der KI auf die Entwicklung von Schutzmaßnahmen.
Quelle: Interview Demis Hassabis
Und du ?
Was halten Sie von der Ankündigung von Google DeepMind zu Gemini? Wie interpretieren Sie die vom CEO von DeepMind versprochenen Fortschritte?