Rafael Henrique | Lichtrakete | Getty Images
OpenAI hat den Chatbot chatgpt Ende 2022 der Öffentlichkeit zugänglich gemacht und der Öffentlichkeit einen Vorgeschmack darauf gegeben, wie neue Chatbots mit generativer KI im Vergleich zur herkömmlichen Suche, mit der Verbraucher in den letzten 25 Jahren nach Online-Informationen gesucht haben, viel gründlichere, kreativere und gesprächsorientiertere Antworten auf Webanfragen liefern können. google, Microsoft und andere folgten mit Konkurrenzprodukten.
Die Branche hat sich schnell von Textantworten zu KI-generierten Fotos und Videos entwickelt. Jetzt kommt der Aufstieg der KI-Agenten.
Anstatt nur Antworten zu liefern – das Reich von Chatbots und Bildgeneratoren – werden Agenten für Produktivität und die Erledigung von Aufgaben entwickelt. Es sind KI-Tools, die Entscheidungen treffen können, im Guten wie im Schlechten, „ohne dass ein Mensch involviert ist“, sagte Kvamme.
Grace Isford, Partnerin bei der Risikokapitalgesellschaft Lux Capital, sagte, das Interesse von Technologieinvestoren an Start-ups, die sich auf die Entwicklung von KI-Agenten konzentrieren, habe „dramatisch zugenommen“. Gemeinsam haben sie Hunderte Millionen Dollar aufgebracht und ihre Bewertungen sind parallel zum breiteren Markt für generative KI gestiegen.
Generative KI explodierte im Jahr 2023, wobei 29,1 Milliarden US-Dollar in fast 700 Deals investiert wurden, was laut PitchBook einer Steigerung des Dealwerts um mehr als 260 % gegenüber dem Vorjahr entspricht. Unterdessen befindet sich die Nicht-KI-Investitionslandschaft seit weit über zwei Jahren in einer anhaltenden Flaute, nachdem es während der Covid-Pandemie Rekordfinanzierungen gegeben hatte.
Wenn 2023 das Jahr des größten KI-Hypes war, dann ist 2024 das Jahr der ersten Bereitstellungen.
„Seit der Einführung von ChatGPT ist wirklich eine wahre Flut von Innovationen auf den Markt gekommen“, sagte Jared Spataro, Corporate Vice President of AI at Work bei Microsoft, gegenüber CNBC. Microsoft ist der größte Unterstützer von OpenAI und hat Milliarden von Dollar in seine eigenen generativen KI-Modelle und -Produkte investiert, zusätzlich zu den Milliarden, die es in den ChatGPT-Entwickler gepumpt hat.
Der Begriff „KI-Agenten“ ist im gesamten Technologiesektor nicht eindeutig definiert. Branchenexperten, die mit CNBC über den aufkommenden Trend sprachen, betrachteten Agenten im Allgemeinen als einen Schritt über Chatbots hinaus, da sie typischerweise für bestimmte Geschäftsfunktionen entwickelt werden und an die großen KI-Modelle angepasst werden können. Denken Sie an JARVIS, Tony Starks vielseitigen KI-Assistenten aus dem Marvel-Universum.
KI-Agenten werden oft als fortschrittliche generative KI-Tools beschrieben, die mehrstufige, komplexe Aufgaben im Namen eines Benutzers ausführen und eigene Aufgabenlisten erstellen können, sodass Benutzer sie nicht Schritt für Schritt durch den Prozess führen müssen.
„Ein Assistent gibt Ihnen nicht nur die Antwort, sondern automatisiert eine Reihe von Schritten“, sagte Francois Ajenstat, Chief Product Officer beim Digitalanalyseunternehmen Amplitude.
Microsoft-CEO Satya Nadella sagte bei einer Telefonkonferenz zu den Quartalsergebnissen Anfang des Jahres, er wolle einen KI-Agenten anbieten, der immer mehr Aufgaben im Auftrag eines Benutzers erledigen könne, allerdings stehe noch „viel Umsetzungsarbeit“ bevor. Auch Führungskräfte von Meta und Google haben ihre Arbeit gelobt, KI-Assistenten immer produktiver zu machen.
Bei Google I/O im Mai kündigte Google das Projekt Astra an, die neueste Weiterentwicklung des KI-Assistenten des Unternehmens, der von Googles KI-Abteilung DeepMind entwickelt wird.
In Googles Demo-Video konnte der Assistent dem Benutzer mithilfe von Video und Audio dabei helfen, sich zu erinnern, wo er seine Brille hingelegt hatte, Code überprüfen und Fragen zu einem angezeigten Objekt beantworten. Im Moment ist es nur ein Prototyp, aber Alphabet-CEO Sundar Pichai sagte, er hoffe, ihn den Benutzern noch in diesem Jahr zur Verfügung stellen zu können.
Die Demo erschien einen Tag, nachdem OpenAI mit ChatGPT eine ähnliche Audio-Konversation hin und her vorgeführt hatte, und positionierte es eher als einen KI-Assistenten, der als Gesprächspartner, Sprachübersetzer, Mathe-Nachhilfelehrer und Co-Autor von Code fungieren kann.
Microsoft folgte auf seiner Entwicklerkonferenz Build und kündigte eine Partnerschaft mit Cognition AI an, die den Kunden Cognitions eigenen KI-Agenten Devin zur Verfügung stellen soll. Cognition bezeichnet Devin als den „ersten KI-Softwareentwickler“.
Devin sorgte in den sozialen Medien schnell für Aufsehen, weil es mehrstufige Prozesse verarbeiten kann. Anstatt nur einfache Codezeilen zu generieren, erstellt Devin einen Problemlösungsprozess, schreibt den Code, testet ihn und liefert ihn dann aus.
Martin Kon, Betriebsleiter des Enterprise-KI-Startups Cohere, sagte, KI-Agenten könnten nun Aufgaben übernehmen, etwa ein Flugticket buchen und die Kosten dafür abrechnen, einen Zinsvorschlag für ein Darlehen unterbreiten oder einem Kunden eine E-Mail mit der Ankunftszeit schicken und Salesforce entsprechend aktualisieren.
Bisher waren die Tools weitgehend auf Aufgaben wie das Schreiben von Code beschränkt. Bei Microsofts GitHub beispielsweise wurden rund 46 % des gesamten Codes „in allen Programmiersprachen“ von KI generiert, schrieb CEO Thomas Dohmke in einem Blogeintrag Anfang 2023.
Während die Grenze zwischen einem KI-Codierungstool und einem echten KI-Agenten fließend ist, sagten die meisten Experten, die mit CNBC sprachen, dass das entscheidende Merkmal eines Agenten darin besteht, dass er weit über einen einzelnen Anwendungsfall hinausgeht und sich einem persönlichen Assistenten mit allen Fähigkeiten annähert.
Anthropic und andere Startups arbeiten bereits an diesem Ziel. Der erste Schritt besteht darin, ihren Chatbots die Fähigkeit zu geben, im Namen des Kunden mit externen Tools und Diensten zu interagieren.
Microsofts Spataro sagte, der Prozess der Entwicklung des Copilot-Programmieragenten seines Unternehmens sei „wie ein Rakete“. Ein großer Teil dessen, was Microsoft tut, bestehe darin, von ein- oder zweistufigen Aufgaben zu mehrstufigen Aufgaben überzugehen. Das könnte bedeuten, dass man sich den Kalender eines Benutzers ansieht und ihm innerhalb von 30 Sekunden einen Überblick darüber gibt, was für den Tag Priorität hat.
Fred Havemeyer, Leiter der US-amerikanischen KI- und Softwareforschung bei Macquarie, schrieb kürzlich in einer Mitteilung an Investoren, dass das Unternehmen sich darauf freue, mehr KI-Agenten zu sehen.
„Wir glauben, dass agentenbasierte KI, die sich selbst auf die Erledigung von Aufgaben ausrichten kann, das Werkzeug sein wird, das den Wert von GenAI für den Alltagsnutzer freisetzt“, schrieb Havemeyer.
Romain Huet, Leiter der Entwicklererfahrung bei OpenAI, erklärte gegenüber CNBC, dass das Konzept der KI-Agenten im letzten Jahr in den Fokus gerückt sei, man jedoch schnell erkannt habe, dass noch Arbeit zu leisten sei, um die Tools autonomer zu machen.
„Wir verfügen über Modelle, die immer leistungsfähiger werden, sodass wir die Absichten der Benutzer jetzt viel besser erfassen können als zuvor. Allerdings stehen wir mit der Entwicklung von Agenten noch ganz am Anfang“, sagte Huet.
Der große Fortschritt werde darin bestehen, dass ein KI-Agent Ihre Präferenzen erkenne und „in Ihrem Namen Maßnahmen ergreife“, ohne dass Sie ihn darum bitten müssten, sagte er.
KI-Agenten-Startups kassieren von Investoren jede Menge Geld. Zwar sind es nicht die Milliardenbeträge, die in KI-Modellunternehmen geflossen sind, aber die Bewertungen liegen immer noch weit über den Geschäftsgrundlagen.
Adept, das von Alumni von OpenAI und Google geleitet wird, erhielt eine Bewertung von über 1 Milliarde US-Dollar letztes Jahr. Das Unternehmen sagt auf seiner Webseite dass seine Technologie „die Komplexität von Softwaretools bewältigt, sodass Sie das nicht tun müssen.“
H, ein französisches KI-Agenten-Startup, sammelte 220 Millionen US-Dollar Startkapital im Mai von Investoren wie Amazon, Samsung, UiPath und Googles Ex-CEO Eric Schmidt. Artisan AI, ein von Y Combinator unterstütztes Startup, das an KI-Agenten arbeitet, die es als „KI-Mitarbeiter für Unternehmen“ bezeichnet, hat kürzlich eine 7,3 Millionen US-Dollar Startkapital und sagt, dass bisher mehr als 100 Unternehmen an Bord gekommen sind.
Jaspar Carmichael-Jack, Gründer und CEO von Artisan AI, sagte, man könne erst im Jahr 2022 mit der Arbeit an echten KI-Agenten beginnen, weil zu diesem Zeitpunkt Chatbots wie ChatGPT es dem Durchschnittsverbraucher erstmals ermöglicht hätten, mit solchen Tools zu interagieren.
„Die Leute reden darüber, dass der VC-Markt im Allgemeinen rückläufig ist“, sagte Carmichael-Jack. „Aber für uns ist es wie 2021 bei KI-Startups.“
Braden Hancock arbeitete bei Facebook Research und Stanfords Artificial Intelligence Lab, bevor er 2019 Snorkel AI mitbegründete. Er sagte, der Markt befinde sich in einem „ähnlichen Hype-Zyklus“ wie der der selbstfahrenden Autos. Und breitere KI-Agenten würden ähnlich lange brauchen, um den Mainstream zu erreichen, sagte er.
Hancock sagte, die Agenten müssten „um ein Vielfaches“ besser sein, bevor die Leute „bereit sind, zu akzeptieren, dass etwas auf Autopilot gestellt wird“. Er fügte hinzu, wenn es darum gehe, dass die Technologie in Ihrem Namen unterschreibt und Geldüberweisungen in Ihrem Namen vornimmt, „liege die Hürde wirklich hoch“.
Kanjun Qius drei Jahre altes Startup Imbue ist geschätzt mit mehr als einer Milliarde Dollar, unterstützt von Amazons Alexa Fund und Eric Schmidt. Basierend auf der eigenen Nutzerforschung des Unternehmens sagte Qiu, dass die aktuelle Charakterisierung von KI-Agenten – als im Allgemeinen intelligente persönliche Assistenten, die delegierte Aufgaben übernehmen – nicht das ist, was die Nutzer eigentlich wollen, da sie von Natur aus „nicht vollständig vertrauenswürdig“ sind.
„Selbst als CEO fällt es mir schwer, Dinge an meine Assistentin zu delegieren“, sagte Qiu. „Ich habe sie seit zwei Jahren und sie ist großartig.“ Bei neuen Dingen, sagte Qiu, „ist es für mich immer noch schwer zu wissen: ‚Okay, wird das so kommen, wie ich es erwartet habe?‘“
Imbue entwickelt Möglichkeiten, wie Benutzer ihre eigenen KI-Software-Agenten erstellen können – ohne Programmierung –, die im Hintergrund für ihre persönlichen Bedürfnisse laufen, sei es die Entwicklung einer Methode zum Verfolgen von Nachrichten oder die Entwicklung eines Bots zum Buchen von Reisen. Diese Art von KI-Modellen müsste nicht mit Benutzerdaten trainiert werden, da jeder Anwendungsfall personalisiert wäre.
Anstatt Aufgaben an einen Agenten zu delegieren, der von Unternehmen wie OpenAI oder Google entwickelt wurde und von diesen zentralisiert und kontrolliert würde, stellt sich Imbue Agenten vor, die die Kontrolle in die Hände der Benutzer legen.
„Man kann sich Agenten so vorstellen, dass sie es jedem ermöglichen, Software zu erstellen“, sagte Qiu. Der Benutzer „fordert den Agenten auf, Code auf dem Computer zu schreiben, damit der Computer das tut, was ich tun möchte.“
BETRACHTEN: „Wir sind noch ein Jahrzehnt davon entfernt“, KI-Probleme zu lösen