Auch wenn es sich anfühlt, als wäre die Welt der künstlichen Intelligenz in den letzten 18 Monaten aus dem Nichts entstanden, handelt es sich dabei um eine Technologie, die fast so alt ist wie die Computerindustrie selbst.
Sogar die generative KI, die Art, die chatgpt, midjourney und Sora antreibt, hat ihre frühesten Wurzeln in den 1950er Jahren, aber was sich in den letzten Jahren geändert hat, ist die Skalierung.
KI hat sich von einer Domäne der Forschung und Hightech zu einem Bestandteil von allem entwickelt, was wir berühren – einschließlich unserer Mobiltelefone. Dies ist das Ergebnis von Fortschritten bei der Rechenleistung, dem Zugang zu Daten und neuen Technologien wie den Basismodellen für Chatbots, Bildgeneratoren und ähnlichen modernen Wundern.
Anstatt diese „neue industrielle Revolution“ zu verpassen, as Nvidia-CEO Jensen Huang nennt eses fühlt sich eher so an, als wäre apple das dunkle Pferd der KI und gut positioniert, um die Chance zu nutzen und sich als Marktführer auf diesem Gebiet zu etablieren.
Warum ist Apple also ein dunkles Pferd im Bereich der KI?
Apple verfügt über ein großes und sehr aktives Team von Forschern, die an verschiedenen KI-Projekten arbeiten. Berichten zufolge steckt das Unternehmen jährlich mehr als eine Milliarde US-Dollar in die KI-Forschung und kauft KI-Startups schneller als alle anderen. Darüber hinaus werden im gesamten Unternehmen Techniken des maschinellen Lernens eingesetzt und die Technologie ist in alle Produkte integriert.
Jedes moderne Apple-Gerät verfügt über eine neuronale Engine als Teil des integrierten Apple Silicon-Chips, die problemlos einige kleine bis mittelgroße Sprachmodelle ausführen kann, und seine Forscher haben Techniken entwickelt, um dies noch effizienter zu machen.
Obwohl Apple möglicherweise zu spät zum KI-Hype gekommen ist, investiert das Unternehmen seit Jahren stark in die Erforschung – und vor allem den Einsatz – von maschinellem Lernen in Software und Hardware.
Vom Wetter bis zur Gesundheit, über Kamerafunktionen und sogar die Transkription basieren viele dieser Prozesse auf von Apple entwickelter oder erworbener KI und werden oft lokal ausgeführt, ohne dass sensible Daten an die Cloud gesendet werden müssen.
Ist Siri nicht schrecklich?
Ja, Siri ist im Vergleich zu anderen modernen KI-Assistenten schrecklich, aber auch nicht so schrecklich, wie viele behaupten. Für einen skriptbasierten KI-Assistenten kann er leistungsstark sein, wenn er mit Verknüpfungen oder anderen externen Funktionen verwendet wird. Es ist auch ein großes Upgrade vorgesehen.
Siri hat auch ein Handicap, das bei anderen Tools nicht zu finden ist. Es führt viele Funktionen, insbesondere im Zusammenhang mit personenbezogenen Daten, vollständig auf dem Gerät aus, während seine Kollegen wie google Assistant und Alexa darauf angewiesen sind, Daten zur Verarbeitung in die Cloud zu senden.
Dies ist Teil der strengen Datenschutz- und Sicherheitsrichtlinien von Apple, die die Sicherheit personenbezogener Daten vorschreiben. Das Unternehmen nutzt zwar die Cloud, verarbeitet die Informationen jedoch zunächst lokal. Diese Anforderung bedeutet, dass es nicht über die leistungsstärksten GPUs in einem Rechenzentrum geht, sondern über einen winzigen Chip in Ihrem Telefon.
Allerdings ist Siri nur das Gesicht von Apples KI. Es ist das offensichtlichste und bei weitem nicht das klügste. Zum Beispiel die Möglichkeit, Text in ein Bild zu kopieren, auf einen Link in einem Screenshot zu klicken oder sogar Ihre Wörter zu transkribieren – alles KI.
Warum nutzen sie dann die KI von Google?
Wir wissen nicht genau, ob Apple tatsächlich den Einsatz von Google AI plant oder ob Apple der erste Ansatz war. Schließlich zahlt Google Apple viel Geld, um es zur Standardsuchmaschine zu machen, und hofft vielleicht auf ein ähnliches Angebot für Gemini, das es zu einem Standard-KI-Angebot in iWork oder Messages macht.
Über die Gespräche kursieren Gerüchte, und selbst wenn sie stattfinden, können wir nicht wissen, worum es geht, bis Apple eine Ankündigung macht.
Die Lösung des Siri-Problems ist für ein so großes Unternehmen kein unüberwindbares Problem. Eine zumindest kurzfristige Lösung könnte darin bestehen, Modelle von anderen Unternehmen wie Google oder OpenAI zu lizenzieren, während das Unternehmen seine eigenen baut – wie Ferret oder MM1.
Mein Instinkt sagt mir, dass der gemunkelte Deal mit Google kaum mehr als ein Entwicklerspiel ist. Apple verfügt über eine umfangreiche Bibliothek an Entwicklertools und -ressourcen und es wäre ein kluger Schachzug, Gemini Nano nativ auf dem iPhone verfügbar zu machen.
Es handelt sich um ein leistungsstarkes und kleines Sprachmodell, das Entwickler bereits für Android entwickeln können. Durch die Lizenzierung für das iPhone erleichtert Apple es einem Entwickler, einmal für iPhone und Android zu schreiben und dasselbe Modell für die Stromversorgung des Systems zu verwenden.
Warum Apple ein dunkles Pferd ist
Apple ist ein sehr großes Unternehmen mit einigen unglaublichen Forschern, viel Geld für die Übernahme anderer Unternehmen und mehr als einer Milliarde Geräten unterschiedlicher Größe und Leistungsfähigkeit in den Händen von Menschen auf der ganzen Welt.
Die meisten dieser Geräte sind bis zu einem gewissen Grad in der Lage, KI-Modelle auszuführen.
Die Forscher von Apple waren damit beschäftigt, eine Reihe von Artikeln darüber zu veröffentlichen, wie man große KI-Modelle auf kleineren Geräten mit weniger leistungsstarken Prozessoren und weniger Speicher zum Laufen bringen kann. Sie haben auch an Frameworks wie MLX gearbeitet, die die Ausführung offener KI-Modelle auf Apple-Hardware einfacher und effizienter machen.
Das Team hat auch eigene neue Modelle erstellt, darunter das frühe Open-Source-Modell Ferret, das Einblicke in die Multimodalität bietet. Gleichzeitig veröffentlichten die großen Player auch multimodale Modelle.
Kürzlich stellten sie MM1 vor, eine Modellfamilie, die auf synthetischen Daten trainiert wurde und eine überraschend gute Antwortrate bei einer einzigen Eingabeaufforderung bietet – genau das, was Sie brauchen, um ein verbraucherorientiertes, benutzerfreundliches Siri 2.0 zu unterstützen.
Das Unternehmen hat auch einen Chatbot im GPT-Stil getestet, der intern auf einer weit verbreiteten offenen Architektur aufbaut, und obwohl es seine Forschung sehr öffentlich macht, bleibt Apple hinsichtlich seiner Produkte so zurückhaltend wie eh und je.
Deshalb nenne ich sie das dunkle Pferd im KI-Rennen. Machen Sie mit bei der WWDC 2024!