google hat sein neues Modell für künstliche Intelligenz (KI) veröffentlicht, das chatgpt Konkurrenz machen soll – und es sieht verdammt beeindruckend aus.
Angerufen ZwillingeDas Modell wurde von Google DeepMind entwickelt, dessen CEO und Mitbegründer Demis Hassabis ist beschreibt In einem Blogbeitrag bezeichnete er es als „das leistungsfähigste und allgemeinste Modell, das wir je gebaut haben“.
Gemini wird Googles KI-Chatbot Bard antreiben, dessen Veröffentlichung Anfang des Jahres eine holprige Veröffentlichung hatte, als sein Werbevideo einige peinliche Fehler enthielt.
Die KI ist in der Lage, die Beantwortung von Fragen in Textform mehr als zu vereinfachen. Es ist tief verwurzelt in Denkfähigkeiten sowie Wissen und Informationen zu weltlichen Themen. Darüber hinaus ist das Modell „multimodal“ konzipiert, d. h. es kann gleichzeitig Text, Audio, Bilder, Video und Computercode verarbeiten.
Wenn Sie ihm beispielsweise ein Video zeigen würden, in dem Sie ein Auto zeichnen, könnte es schnell erkennen, was Sie vorhaben, und im Wesentlichen sagen: „Ja, das ist ein Auto.“ Sie könnten dann ein anderes Auto zeichnen und das Modell fragen, welches aufgrund seines Designs und seiner Aerodynamik theoretisch schneller fahren würde.
Eine Reihe weiterer Beispiele für die Intelligenz von Gemini finden Sie in den Demovideos unten.
Zwillinge wurden auf ihre Problemlösungsfähigkeiten und ihr Wissen in 57 Fachgebieten getestet – darunter Mathematik, Physik, Geschichte, Recht, Medizin und Ethik – und es wurde festgestellt, dass sie menschliche Experten übertreffen. Google gab außerdem an, dass Gemini bei 30 von 32 Benchmark-Tests zur Bewertung des logischen Denkens und des Bildverständnisses auf einem höheren Niveau abschnitt als andere „moderne“ KI-Modelle (wie ChatGPT-4).
Die erste Version, Gemini 1.0, ist in drei verschiedenen Größen erhältlich – Ultra, Pro und Nano – die je nach den Bedürfnissen des Programms und des Benutzers verwendet werden. Ultra wird beispielsweise am leistungsstärksten sein, für die meisten alltäglichen Anforderungen jedoch unnötig leistungsstark sein.
Bard wird ab heute eine Version von Gemini Pro verwenden und Google plant, in den kommenden Monaten andere Formen des neuen KI-Systems in andere Produkte wie Suche, Anzeigen und Chrome zu integrieren. Einige der in diesem Artikel gezeigten Demonstrationen werden vorerst für die meisten Sterblichen nicht zugänglich sein, aber theoretisch werden sie irgendwann für jedermann zugänglich sein.
In der Ankündigung von Google wollte Google betonen, dass Gemini mit Blick auf Verantwortung und Sicherheit geschaffen wurde. Der jüngste Ansturm der KI-Technologie hat bei vielen Menschen, darunter Branchenführern und Wissenschaftlern, die Sorge geweckt, dass wir die Büchse der Pandora öffnen könnten, indem wir ein System schaffen, das so leistungsfähig ist, dass es Amok laufen könnte.
Während Google Gemini und seine allmächtigen Fähigkeiten enthüllte, versuchte es, einige dieser Ängste zu zerstreuen.
„In jeder Entwicklungsphase berücksichtigen wir potenzielle Risiken und arbeiten daran, diese zu testen und zu mindern“, sagte Google in dem Blogbeitrag.
„Gemini verfügt über die bisher umfassendsten Sicherheitsbewertungen aller Google-KI-Modelle, auch hinsichtlich Voreingenommenheit und Toxizität […] Wir werden bei der Entwicklung von Gemini weiterhin mit Forschern, Regierungen und zivilgesellschaftlichen Gruppen auf der ganzen Welt zusammenarbeiten.“