Bevor der Artikel beginnt, möchte ich Ihnen etwas Kaltes sagen: Dieses Jahr ist das 15. Jahr, in dem google die I/O Developer Conference veranstaltet.
Bei den I/O-Konferenzen der letzten sieben Jahre hatten KI-Inhalte für Google immer höchste Priorität. Bevor beispielsweise chatgpt populär wurde, hatte Google bereits auf der I/O-Konferenz die LaMDA-Reihe von Sprachgenerierungsmodellen demonstriert, aber nicht auf die Gelegenheit des Feuers gewartet.
Heute hat der Ausbruch von ChatGPT die KI auf den Höhepunkt gebracht, aber sie löst bei Google auch große Besorgnis aus.
Nachdem Google die gesamte Konferenz verfolgt hatte, erwähnte es das Wort „KI“ fast 200 Mal und schrieb KI fast in alle Produkte ein, einschließlich Gmail, Suche, Pixel usw., um allen zu beweisen, dass es immer noch an der Spitze der KI steht.
Hätte diese Konferenz vor einem halben Jahr stattgefunden, wäre sie äußerst spannend gewesen: KI-unterstütztes Büro, KI-Suche, KI-Programmierung, allesamt wichtige technische Anwendungen. Schade, dass Microsoft schon vorher den ganzen Weg gegangen ist.
Man kann sogar sagen, dass die Reaktion des Publikums ein wenig unterkühlt war. Tatsächlich gab es nur zwei große Beifallsrufe: Bards Dunkelmodus und das kostenlose Dock für das Pixel-Tablet.
Auf der heutigen I/O-Konferenz sind die von Google veröffentlichten neuen Produkte und Technologien wie eine Aufholjagd mit Microsoft und OpenAI – eine Aufholjagd mit der präventiv verwirklichten KI-Zukunft.
PaLM2, Googles Geheimwaffe gegen GPT-4
Das große Sprachmodell ist zum Spitzenprodukt im Technologiekreis geworden. Jedes Unternehmen hofft, ein selbst entwickeltes Modell zu entwickeln, das GPT herausfordern kann, seine wissenschaftliche Forschungsstärke unter Beweis zu stellen, und Google ist keine Ausnahme.
Google hat eine neue Generation des großen Sprachmodells PaLM2 veröffentlicht, das mit GPT-4 konkurrieren soll.
Laut Google haben sie eine große Anzahl mathematischer und wissenschaftlicher Datensätze verwendet, um PaLM 2 zu trainieren. Im Vergleich zum letztjährigen PaLM-Modell hat PaLM 2 seine mehrsprachigen Verarbeitungs-, Argumentations- und Codierungsfunktionen erheblich verbessert.
Laut dem offiziellen Test von Google sind einige Ergebnisse von PaLM2 (z. B. Mathematik) besser als GPT-4.
Google gab die spezifische Parameterskala von PaLM 2 nicht bekannt und erwähnte lediglich, dass PaLM 2 auf den neuesten JAX- und TPU v4-Rechnerfunktionen basiert. Google hat den Algorithmus von PaLM 2 optimiert, sodass er kleiner als PaLM ist, aber insgesamt eine bessere Leistung und eine höhere Recheneffizienz aufweist.
PaLM 2-Unterstützungapple-converted-space“> Mehr als 100 verschiedene Sprachen und mehr als 20 Programmiersprachen, darunter JavaScript, Python, Prolog, Verilog, Fortran usw., können als Sprachmeister bezeichnet werden.
Es reicht nicht aus, herkömmliches Textverständnis und -generierung durchzuführen. PaLM 2, das Multimodalität unterstützt, kann auch Audio- und Videoinhalte verstehen und generieren. Google hat ein Modell namens Med-PaLM gezeigt, das auf den medizinischen Bereich abgestimmt ist. Laut X Leichte Filmanalyse von Patientenverletzungen, Google hat in dieser Hinsicht das Niveau menschlicher Ärzte erreicht.
Das PaLM 2-Modell kann auch in 4 Versionen unterschiedlicher Größe „aufgeteilt“ und auf verschiedenen Geräten eingesetzt werden. Beispielsweise kann ein relativ kleines Gecko-Modell auf einem Smartphone ausgeführt werden, sodass das mobile Endgerät auch über ein großes Sprachmodell verfügen kann.
Erwähnenswert ist, dass PaLM 2 derzeit zur Vorschau geöffnet ist und Googles eigener Chat-Roboter Bard das PaLM 2-Modell verwendet hat, um seine Antwortfähigkeiten zu verbessern. Google Content verfügt über mehr als 70 Produktteams, die PaLM 2 zum Erstellen von Produkten verwenden. Die meisten Updates auf dieser Konferenz basieren auf dem PaLM 2-Modell. Man kann sagen, dass PaLM 2 die Kernmaschine der umfassenden KI von Google ist.
Neben PaLM 2 hat Google-CEO Sundar Pichai auch die Neuigkeiten über das Großmodell Gemini (Gemini) der nächsten Generation leicht verdorben, das seiner Meinung nach multimodal, effizient und für zukünftige Innovationen ausgelegt sei. .
Gemini ist ein neues Modell, das gemeinsam durch den Zusammenschluss zweier Top-KI-Teams, Google Brain und DeepMind, entwickelt wurde. Aus dem Namen geht hervor, dass Gemini die Stärken der beiden vereinen wird und voraussichtlich zu den leistungsstärksten großen Sprachmodellen zählt .
Barde: Upgrade multimodal, in der Lage, Bilder zu zeichnen und zu lesen
Es sieht besser aus, ist umfassender und kann von mehr Menschen genutzt werden.
Nach weniger als zwei Monaten Aktualisierungen migrierte Google Bard auf das leistungsfähigere große Sprachmodell PalM2, einen Konkurrenten von ChatGPT und BingChat, der deutlich aktualisiert und leistungsfähiger wurde:
- Löschen Sie die Warteliste und öffnen Sie sich für mehr als 180 Länder und Regionen;
- Bildfrage und -antwort hinzugefügt, der Dialog ist intuitiver;
- Integrieren Sie Adobe Firefly, um schnell Bilder zu erstellen.
- Quellenangaben, Dunkelmodus, Code-Export-Schaltfläche, Aktualisierung weiterer Details.
Britische und amerikanische begrenzt, nur Englisch, Warteliste, es ist nicht einfach, Bard mit vielen Einschränkungen zu verwenden. Mit Wirkung heute gibt Bard offiziell die Streichung der Warteliste bekannt und öffnet das Erlebnis für mehr als 180 Länder und Regionen.
Bard unterstützt jetzt auch Japanisch und Koreanisch und wird die Unterstützung bald auf 40 Sprachen, einschließlich Chinesisch, erweitern.
Auch hinsichtlich der Funktionen hat Bard erhebliche Verbesserungen erfahren, die sich in vier Worten zusammenfassen lassen: „sowohl Bilder als auch Texte“. Wenn Bard Fragen stellt, ist er nicht länger ein Roboter, der nur trocken auf Texte antworten kann, sondern uns auch reichhaltigere und intuitivere Antworten in Form von Bildern zeigen kann.
Gleichzeitig brachte Google Bard auch die Fähigkeit von Google Lens ein, sodass dieser nicht nur auf Bilder antworten, sondern auch Bilder verstehen und Inhalte basierend auf Bildinformationen entwerfen kann. Sie könnten ihm beispielsweise ein Foto eines Hundes schicken und ihn bitten, Bildunterschriften basierend auf der Hunderasse zu schreiben.
Vielleicht liegt es daran, dass die Funktion „Vincents Bild nebenan“ zu beliebt ist. Google hat diese Funktion auch zu Bard hinzugefügt, kooperiert aber mit Adobe Firefly. Durch die Integration von Firefly’s Bard können hochwertige Bilder in natürlicher Sprache generiert werden. Und mit der Unterstützung von Adobe müssen Sie sich keine Sorgen um das Urheberrecht und die Qualität der Bilder machen.
Adobe ist erst der Anfang und Google wird mit Kayak, OpenTable, Zip-Recruiting-Unternehmen, der Khan Academy und anderen Partnern zusammenarbeiten, um Bard um weitere Funktionen zu erweitern.
Im Vergleich zu ChatGPT ist Bards Positionierung stärker auf BingChat ausgerichtet. Dabei handelt es sich um eine Suchmaschine und ein Produktivitätstool. Nächste Woche wird es eine Referenzfunktion hinzufügen und die Quelle für den generierten Code anzeigen, um die Genauigkeit sicherzustellen. Und die Möglichkeit, Code zu exportieren und auszuführen, wurde hinzugefügt, um Entwicklern ein effizientes Arbeiten zu erleichtern. Übrigens wurde ein dunkler Modus hinzugefügt, der für Jubel in der Szene sorgte.
Obwohl es in seinem Debüt einige Oolongs gab, zeigte uns Google dennoch einen sich ständig verbessernden Bard. Schade, dass „wir“ das Wort ist, das wir in der Einleitung am häufigsten gehört haben. Nachdem alle heute veröffentlichten Funktionen implementiert und gestartet sind, wird Bard ein ausreichend umfassendes und ausgereiftes Tool sein.
Duet AI: Erledigen Sie Büroaufgaben mithilfe von KI
Hier kommt der Copilot-Konkurrent.
Google hat für seinen Workspace ein neues Tool, Duet AI, eingeführt, das uns einen Einblick in die Rolle der KI in der cloudbasierten Google Office-Suite ermöglicht:
- Dokumentation: Fassen Sie den vollständigen Text zusammen und schreiben Sie ihn automatisch.
- Diashow: Vincent-Diagramm, Effizienzsteigerung;
- Tabellen: Daten analysieren, Strategien entwickeln.
In Google Docs können Sie Duet AI mitteilen, was Sie erstellen möchten, und automatisch Artikel generieren lassen. Sie können es auch unterschiedliche Schreibstile generieren lassen, je nach Ihren Bedürfnissen.
Auch die „ChatPDF“-Funktion zum „Lesen“ von Artikeln und Schlüsselfragen bleibt nicht außen vor.
Diese Funktionen zur Textgenerierung, -erweiterung und -anpassung werden auch in Google Mail verwendet.
Bei Diashows fungiert Duet AI als Bildgenerator, der Ihnen dabei helfen kann, Zeit bei der Suche nach Bildern im Internet zu sparen und Diashows mit Originalinhalten anzureichern.
Im Formular kann Duet AI die Daten automatisch entsprechend Ihren Fragen organisieren, um die Daten standardisierter zu machen.
Diese Funktionen können auch mit anderen Google-Diensten verknüpft werden. Nachdem Sie beispielsweise ein Formular in Bard erstellt haben, können Sie mit einem Klick ein Formulardokument für die spätere Verwendung generieren.
Duet AI hat außerdem eine Reihe von durch maschinelles Lernen gesteuerten Google Cloud-Entwicklungstools hinzugefügt, die Codefehlerkorrektur, -generierung usw. in Echtzeit ermöglichen und mehrere Entwicklungssprachen wie Go, Java, Javascript, Python usw. unterstützen SQL.
Wir müssen nicht darauf warten, dass Bard besteht, sondern können jetzt auf Duet AI warten. Wenn Sie diese Funktionen erleben möchten, müssen Sie sich trotzdem auf die Warteliste setzen und darauf warten, dass Google den Test in der entsprechenden Region öffnet.
Im Allgemeinen ist Duet AI weniger erstaunlich als Copilot zum ersten Mal zu sehen, und die Funktionsdemonstration scheint schwächer zu sein. Aber es dauerte weniger als zwei Monate, bis Bard aufgeholt hatte. Freuen Sie sich auf weitere Möglichkeiten, die Duet AI bietet.
Google-Suche: Neu definiert, alles
Zukünftige Suchanfragen könnten so aussehen:
Angetrieben durch PaLM 2 hat auch die Google-Suche eine Innovation eingeläutet und eine neue Suchmaschine SGE (Search Generative Experience) eingeführt. Sie müssen eine große Frage nicht mehr in mehrere kleine Fragen aufteilen und die Antworten anschließend zusammensetzen Suchen: Mit dem Segen der generativen KI können Sie der Suche schwere Arbeit überlassen.
Auf der Konferenz betonte Google die Verbesserung der generativen KI beim Einkaufen. Wenn Sie mit Google nach einem Produkt suchen, werden Ihnen dessen Produktbeschreibung, Bewertungen, Preise und Anzeigebilder angezeigt.
Google verfügt über mehr als 35 Milliarden Produkteinträge und aktualisiert diese ständig mit einer Geschwindigkeit von 1,8 Milliarden pro Stunde. Wenn Sie bei Google suchen und einkaufen, erhalten Sie aktuellere und zuverlässigere Ergebnisse.
Google ist davon überzeugt, dass Werbung ein wichtiger Teil des Internets ist, und wird weiterhin an seinem Engagement für Werbetransparenz festhalten und sicherstellen, dass Anzeigen und Suchergebnisse unterschieden werden.
Google öffnet heute die Anmeldung für Search Labs und öffnet den Zugang in den kommenden Wochen, wobei die Google-App und der Chrome-Browser unterstützt werden. Der Anwendungslink lautet wie folgt: labs.google.com/search
Googles KI-Angst kann nur mit KI gelöst werden
Einige Leute sagen scherzhaft, dass die diesjährige Google I/O Google AI/O heißen sollte. Die Juwelen von Microsoft und OpenAI liegen vorne, und Google hat einen etwas weniger erstaunlichen Moment, aber dies ist zweifellos Googles entschlossenste Selbstrevolution der letzten Jahre.
Google, das behauptet, AI-first zu sein, hat aufgrund seiner übermäßig vorsichtigen und konservativen Strategie schon oft Chancen verpasst. Jetzt hat Google endlich erkannt, dass es, wie viele Google-Führungskräfte sagten, schnell handeln muss, um „mutig und verantwortungsbewusst“ zu sein, und darf nicht länger aus Angst vor Fehlern zögern.
Natürlich ist KI kein Allheilmittel, und der aktualisierte Bard kann möglicherweise nicht den Trend ändern, dass die Google-Suche untergraben wird. Aber es besteht kein Zweifel daran, dass KI die Suche neu gestalten und diese Interaktion revolutionieren wird.
Bing, dessen Anteil weit unter dem von Google liegt, hat durch Chatbots in nur wenigen Monaten mehr als 100 Millionen täglich aktive Nutzer erreicht und mehr als 500 Millionen Chats durchgeführt, davon 70 % der Nutzer, die die neue Bing-Chat-Funktion ausprobieren wird es für suchbezogene Aufgaben verwenden.
Wenn die größte Suchmaschine der Welt beschließt, die Last der Vergangenheit aufzugeben und diesen Trend voll und ganz anzunehmen, wird sich möglicherweise nicht nur die Zukunft von Google ändern, sondern es könnte auch die Funktionsweise des Internets untergraben und die Interaktion von Milliarden von Nutzern verändern .
Eine neue, einfachere Welt kommt.