Bevor wir beginnen, möchte ich Ihnen einige Fakten verraten: Dieses Jahr findet die google I/O-Konferenz bereits zum 15. Mal statt.
In den letzten sieben Jahren der I/O-Konferenzen war KI immer die oberste Priorität von Google. Bevor beispielsweise chatgpt populär wurde, zeigte Google auf der I/O-Konferenz die LaMDA-Reihe von Sprachmodellen, die jedoch nicht beliebt war. Die Popularität von ChatGPT bescherte der KI ihren Höhepunkt, machte Google aber auch große Sorgen. Als Google die gesamte Konferenz verfolgte, erwähnte Google das Wort „KI“ fast 200 Mal und schrieb KI fast in alle Produkte wie Gmail, Suche, Pixel usw. ein, um allen zu beweisen, dass es sich immer noch um ein hochmodernes KI-Unternehmen handelt.
Hätte diese Konferenz vor einem halben Jahr stattgefunden, wäre sie äußerst spannend gewesen: KI-gestützte Büroarbeit, KI-Suche, KI-Programmierung, allesamt ein großes technologisches Update. Schade, dass sich Microsoft das ganze Rampenlicht geschnappt hat, und die Reaktion des Publikums war sogar etwas kühl. Es gab nur zwei Beifallsrufe: Bards Dunkelmodus und das kostenlose Dock für das Pixel-Tablet.
Auf dieser I/O-Konferenz scheinen die neuen Produkttechnologien von Google mit Microsoft und OpenAI gleichzuziehen – und zwar mit der präventiv realisierten KI-Zukunft.
PaLM 2, Googles Geheimwaffe gegen GPT-4
Das große Sprachmodell ist zum Spitzenprodukt im Technologiekreis geworden, und jedes Unternehmen möchte ein mit GPT vergleichbares Modell entwickeln, um seine Stärke zu beweisen, und Google ist da keine Ausnahme. Google hat dieses Mal ein neues großes Sprachmodell PaLM 2 gegen GPT-4 veröffentlicht. Google einführenPaLM 2 wird mit einer großen Anzahl mathematischer und wissenschaftlicher Datenbanken trainiert. Im Vergleich zum letztjährigen PaLM-Modell haben sich die mehrsprachigen Verarbeitungs-, Argumentations- und Programmierfähigkeiten von PaLM 2 erheblich verbessert.
Einige Ergebnisse des PaLM 2-Tests von Google, wie zum Beispiel Mathematik, sind besser als GPT-4. Google hat die Parameterskala von PaLM 2 nicht bekannt gegeben, sondern nur erwähnt, dass PaLM 2 auf den neuesten JAX- und TPU v4-Rechenfunktionen basiert. Google hat den PaLM 2-Algorithmus optimiert, um das Volumen kleiner als bei PaLM zu machen, aber die Gesamtleistung ist besser und die Berechnungseffizienz höher.
PaLM 2 unterstützt mehr als 100 Sprachen und mehr als 20 Programmiersprachen, darunter JavaScript, Python, Prolog, Verilog, Fortran usw. Es kann als Sprachmeister bezeichnet werden. Es reicht nicht aus, nur herkömmliches Textverständnis und -generierung durchzuführen. Es unterstützt das multimodulare PaLM 2 und kann auch audiovisuelle Inhalte verstehen und generieren. Google zeigt Med-PaLM, ein speziell für den medizinischen Bereich abgestimmtes Modell, das dies kann Analysieren Sie Patientenverletzungen anhand von Röntgenstrahlen. Google Dieser Aspekt hat das Niveau menschlicher Ärzte erreicht.
Das PaLM 2-Modell kann auch in 4 Versionen „aufgeteilt“ werden, die auf verschiedenen Geräten eingesetzt werden können. Beispielsweise kann ein Smartphone ein kleineres Gecko-Modell ausführen, und ein mobiles Gerät kann auch über ein großes Sprachmodell verfügen. PaLM 2 ist zur Vorschau geöffnet und Googles eigener Chat-Roboter Bard hat das PaLM 2-Modell verwendet, um seine Antwortfähigkeit zu verbessern. Google Content verfügt über mehr als 70 Produktteams, die PaLM 2 zum Erstellen von Produkten verwenden. Die meisten Updates basieren auf dem Modelldesign von PaLM 2. Man kann sagen, dass PaLM 2 die Kernmaschine der umfassenden KI von Google ist.
Neben PaLM 2 hat CEO Sundar Pichai auch die Neuigkeiten über das Großmodell Gemini (Gemini) der nächsten Generation leicht verdorben und erklärt, dass Gemini darauf abzielt, Multimodalität, Effizienz und Innovation für die Zukunft zu erreichen. Gemini ist ein neues Modell, das gemeinsam durch den Zusammenschluss zweier Top-KI-Teams, Google Brain und DeepMind, entwickelt wurde. Wie aus dem Namen hervorgeht, vereint Gemini die Stärken der beiden und wird voraussichtlich zu den leistungsstärksten großen Sprachmodellen gehören.
Barde: Multimodul aufrüsten, kann Bilder zeichnen und lesen
Es sieht besser aus, ist umfassender und kann von mehr Menschen genutzt werden. Weniger als zwei Monate nach dem Update hat Google Bard auf das leistungsfähigere große Sprachmodell PalM 2 umgestellt, einen wesentlich aktualisierten und leistungsfähigeren Konkurrenten zu ChatGPT und BingChat:
- Löschen Sie die Warteliste und eröffnen Sie mehr als 180 Länder.
- Bildfrage und -antwort hinzugefügt, der Dialog ist intuitiver.
- Integrieren Sie Adobe Firefly, um schnell Bilder zu erstellen.
- Quellenangaben, Dunkelmodus, Code-Export-Schaltfläche, Aktualisierung weiterer Details.
Britische und amerikanische Einschränkungen, nur Englisch, Warteliste, es ist nicht einfach, Bard mit vielen Einschränkungen zu verwenden. Aber von nun an wird Bard die Warteliste streichen und das Erlebnis in mehr als 180 Ländern eröffnen. Bard unterstützt derzeit Japanisch und Koreanisch und wird bald auf 40 Sprachen erweitert, darunter auch Chinesisch.
Auch in Bezug auf die Funktionen wurde Bard stark verbessert, und die Zusammenfassung mit vier Wörtern besteht aus „sowohl Bildern als auch Texten“. Beim Stellen von Bard-Fragen handelt es sich nicht mehr um einen Roboter, der nur trocken mit Text antworten kann, sondern mit Bildern reichhaltigere Antworten anzeigen kann. Google hat auch die Google Lens-Funktion in Bard integriert, die nicht nur Bilder beantworten, sondern auch Bilder verstehen, Aufsätze basierend auf Bildinformationen schreiben kann, beispielsweise ein Hundefoto, und sie nach der Hunderasse betiteln kann.
Vielleicht aufgrund der begeisterten Kritiken von Vincents Bildfunktion nebenan hat Google die gleiche Funktion auch zu Bard hinzugefügt, aber es hat mit Adobe Firefly zusammengearbeitet, und Bard kann durch die Integration von Firefly qualitativ hochwertige Bilder in natürlicher Sprache erzeugen. Mit der Unterstützung von Adobe besteht kein Grund zur Sorge um die Qualität der Bildurheberrechte, und Adobe ist erst der Anfang. Google wird auch mit Partnern wie Kayak, OpenTable, zip manpower und Khan Academy zusammenarbeiten, um Bard um weitere Funktionen zu erweitern.
Die Positionierung von Bard ist eher BingChat und berücksichtigt sowohl Suchmaschinen als auch Produktivitätstools. Nächste Woche wird eine Referenzfunktion hinzugefügt, um die Codequelle anzuzeigen und die Genauigkeit sicherzustellen. Funktion zum Exportieren und Ausführen von Code hinzugefügt, um Entwicklern die Arbeit zu erleichtern. Übrigens wurde ein neuer Dark-Modus hinzugefügt, der für Jubel in der Szene sorgte. Obwohl es beim ersten Erscheinen ein Oolong war, ließ Google die Leute immer noch die kontinuierliche Verbesserung von Bard sehen, aber leider ist das am häufigsten gehörte Wort „wir.“ Nachdem alle heute veröffentlichten Funktionen implementiert wurden, wird Bard als umfassend und umfassend angesehen ausgereiftes Werkzeug.
Duet AI: Der gesamte Papierkram wird an AI übergeben
Hier kommt der Copilot-Konkurrent. Google stellt ein neues Tool Duet AI für Workspace vor und sieht die Rolle der KI-Cloud-basierten Google-Bürosoftware:
- Word: Den vollständigen Text zusammenfassen und automatisch schreiben
- PowerPoint: Vincent-Diagramm, Effizienz verbessern
- Excel: Daten analysieren, Strategien entwickeln
Sie können Duet AI mitteilen, welche Inhalte Sie erstellen möchten, und es automatisch Artikel generieren lassen. Sie können es auch unterschiedliche Schreibstile generieren lassen, je nach Ihren Bedürfnissen. Die „ChatPDF“-Funktion zum „Lesen“ von Artikeln und Schlüsselfragen bleibt nicht zurück, und Google Mail bietet auch Textgenerierung, -erweiterung und -anpassung.
Bei Präsentationen fungiert Duet AI als Bildgenerator, spart Zeit bei der Suche nach Bildern im Internet und bereichert Diashows mit Originalinhalten.
Duet AI kann die Daten automatisch entsprechend den Fragen organisieren, um die Daten aufgeräumter zu gestalten.
Diese Funktionen können auch mit anderen Google-Diensten zusammenarbeiten. Nachdem Bard beispielsweise ein Online-Formular erstellt hat, kann es mit einem Klick in eine Dokumentdatei für die spätere Verwendung umgewandelt werden. Duet AI fügt außerdem auf maschinellem Lernen basierende Google Cloud-Entwicklungstools hinzu, mit denen Code in Echtzeit korrigiert, generiert usw. werden kann und mehrere Entwicklungssprachen wie Go, Java, Javascript, Python und SQL unterstützt.
Sie müssen nicht mehr auf Bard warten, sondern jetzt auf Duet AI. Wenn Sie neue Funktionen erleben möchten, müssen Sie sich weiterhin auf die Warteliste setzen und darauf warten, dass Google den Test öffnet. Insgesamt fehlt Duet AI die Überraschung, Copilot zum ersten Mal zu sehen, und seine Funktionen scheinen schwach zu sein, aber Bard hat in weniger als zwei Monaten aufgeholt, also erwarten Sie mehr Möglichkeiten von Duet AI.
Google-Suche: Neu definiert, alles
Zukünftige Suchen sollten so aussehen:
Angetrieben durch PaLM 2 hat auch die Google-Suche Innovationen angenommen und eine neue Suchmaschine SGE (Search Generative Experience) eingeführt, die große Fragen nicht mehr in mehrere kleine Fragen aufteilen und die Antworten nach der Suche zusammenfügen muss. Mit dem Segen der Generativen KI, Sie können die Suche die grobe Arbeit erledigen lassen.
Google zeigt, wie generative KI das Einkaufen verbessern kann. Wenn Sie bei Google nach einem Produkt suchen, sehen Sie dessen Produktbeschreibung, Rezensionen, Preise und Anzeigebilder. Google verfügt über mehr als 35 Milliarden Produkteinträge und aktualisiert diese ständig mit einer Geschwindigkeit von 1,8 Milliarden pro Stunde. Wenn Sie Google zum Suchen und Einkaufen nutzen, erhalten Sie aktuellere und zuverlässigere Ergebnisse.
Google ist davon überzeugt, dass Werbung ein wichtiger Teil des Webs ist und wird weiterhin an seinem Engagement für Werbetransparenz festhalten und Anzeigen und Suchergebnisse getrennt halten.Ab sofort ist auch Google geöffnetDurchsuchen Sie die Laborregistrierungund in wenigen Wochen Open Access, mit Unterstützung der Google App und des Chrome-Browsers.
Googles KI-Angst kann nur mit KI gelöst werden
Einige Leute scherzten, dass die diesjährige Google I/O Google AI/O heißen sollte. Microsoft und OpenAI sind führend, und Google hat einen kleinen erstaunlichen Moment verloren, aber es ist zweifellos Googles entschlossenste Selbstrevolution der letzten Jahre. Google, das behauptet, bei der KI an erster Stelle zu stehen, hat aufgrund seiner vorsichtigen und konservativen Strategie schon oft Gelegenheiten verpasst. Jetzt erkennt Google endlich, dass es schnell handeln muss, genau wie das „mutige und verantwortungsbewusste Unternehmen“, das viele Google-Führungskräfte gesagt haben, und es auch kann Zögern Sie nicht länger aus Angst, Fehler zu machen. Nicht vorher.
Natürlich ist KI kein Allheilmittel. Nach einem großen Upgrade kann Bard den Trend, von der Google-Suche überholt zu werden, vielleicht nicht ändern, aber es besteht kein Zweifel, dass KI die Suche neu gestalten und die Art und Weise der Mensch-Computer-Interaktion völlig verändern wird . Sein Anteil liegt weit unter dem von Googles Microsoft Bing. In nur wenigen Monaten gibt es Hunderte Millionen täglich aktive Nutzer und mehr als 500 Millionen Chats. 70 % der Nutzer, die die neue Bing-Chat-Funktion ausprobieren, nutzen sie auch für die Suche.
Wenn die größte Suchmaschine der Welt beschließt, ihren Ballast aufzugeben und neue Trends voll und ganz anzunehmen, könnte dies nicht nur die Zukunft von Google verändern, sondern möglicherweise auch den Netzwerkmechanismus untergraben und die Interaktionsart von Milliarden von Nutzern verändern. Eine neue, einfachere Welt kommt.
(Dieser Artikel wird gesponsert von Lieber Fan Zum Nachdruck berechtigt; erste Bildquelle: Google)
Weiterführende Literatur: