Der erfolgreichste Marketingbegriff aller Zeiten dürfte „künstliche Intelligenz“ sein, denn nein, Computer können immer noch nicht denken. Was sollte den zweiten Platz belegen? Wie wäre es mit „Open-Source-Künstliche Intelligenz“. Eine beliebte Vorhersage über die Entwicklung der Technologie im Jahr 2024 ist, dass Open-Source-KI-Modelle zu proprietären Modellen wie chatgpt und Googles Bard aufschließen werden. Das klingt zunächst vielversprechend. Wenn kostenlose KI-Tools technisch genauso leistungsfähig werden wie die von Technologiemonopolen bereitgestellten, bedeutet das, dass jemand die Dominanz der Big Tech in der möglicherweise transformativsten Technologie der Welt in Frage stellt.
Allerdings gibt es einen Vorbehalt: Einige der vielversprechendsten Open-Source-KI-Modelle sind nicht wirklich offen oder entziehen sich der Kontrolle großer Technologieunternehmen.
Unter Open Source versteht man Software, die jedem Mitglied der Öffentlichkeit frei zur Ansicht, Änderung und Verbreitung nach eigenem Ermessen zur Verfügung steht. Außerhalb der KI können diese Tools, wie die Blog-Hosting-Plattform WordPress oder die Bildbearbeitungssoftware GIMP, im Vergleich zu dem, was Sie vielleicht von google oder apple Inc. kaufen, etwas unausgereift wirken, aber sie haben einen demokratisierten Zugang dazu neue, digitale Services. WordPress beispielsweise ermöglichte es Millionen kleiner Unternehmen, kostengünstig eine Online-Präsenz aufzubauen.
Mittlerweile sieht es so aus, als würde sich die KI in eine ähnliche Richtung bewegen: Eine Reihe von Open-Source-Projekten von Unternehmen wie Mistral und Hugging Face bieten kostenlose Alternativen zu den Modellen etablierter KI-Firmen. Aber einige der größten dieser Projekte werden von Technologiegiganten unterstützt, die Einschränkungen eingeführt haben, die den Open-Source-Standards zuwiderlaufen – was sie schließlich doch nicht so frei macht und ihre Beschreibungen etwas irreführend macht.
Meta Platforms Inc. veröffentlichte beispielsweise im Jahr 2023 ein Open-Source-Sprachmodell namens Llama 2, dessen Lizenz es Entwicklern jedoch verbietet, es zum Trainieren anderer Sprachmodelle zu verwenden. Bei Open-Source-Software gibt es bestimmte Parameter für die Art und Weise, wie Code verwendet wird. Diese können variieren, um beispielsweise sicherzustellen, dass die Software bei ihrer Verbreitung Open Source bleibt. Aber die Verwendung von Code für andere Zwecke einzuschränken – wie zum Beispiel das Training anderer KI-Modelle – ist weniger liberal als normal.
Wenn Sie ein Startup sind, das das nächste Facebook oder Google aufbauen möchte, müssen Sie auch zusätzliche Hürden überwinden, um das System von Meta zu nutzen, und eine separate Lizenz vom Unternehmen erwerben, wenn Sie mehr als 700 Millionen tägliche Nutzer haben. Laut einer Studie von Forschern der Carnegie Mellon University, des AI Now Institute und des Signal aus dem Jahr 2023 ist das Modell auch nicht so transparent, wie ein Open-Source-Projekt sein sollte, insbesondere wenn es um die Daten geht, die Meta zum Trainieren von Llama 2 verwendet Stiftung. Sie kamen zu dem Schluss, dass Big Tech den Begriff „Open Source“ als Markenbemühungen nutzte, um bei Regulierungsbehörden und der Öffentlichkeit besser aufzutreten.
Llama entspricht nicht der allgemein akzeptierten Definition von „Open Source“, wie sie von der Open Source Initiative (OSI) vorgeschlagen wird, einer gemeinnützigen Organisation, die die Kriterien für Software festlegt, die als Open Source gilt. Das OSI hat sogar gesagt, dass die Verwendung des Begriffs durch Meta falsch sei und dass das Unternehmen aufgefordert wurde, „seine falschen Angaben zu korrigieren“.
Ein Sprecher von Meta sagte, das Unternehmen wolle „Unternehmen und Entwicklern helfen, die möglicherweise über begrenzte Ressourcen verfügen, dennoch Zugriff auf große Sprachmodelle wie Llama 2 zu haben, sodass es für die überwiegende Mehrheit der Benutzer kostenlos ist.“ Sie gingen nicht auf Fragen zu Lizenzbeschränkungen ein.
Der Begriff „Open Source“ wurde so großzügig verwendet, dass offenbar große Verwirrung über die Bezeichnung herrscht. Als Apple kürzlich ein KI-Modell namens Ferret herausbrachte, wurde es in Presseberichten als „Open Source“ beschrieben, die Lizenz enthielt jedoch mehrere Klauseln, die darauf hinwiesen, dass dies nicht der Fall war, und das Modell selbst war nur für Forschungszwecke gedacht.(1) Apple lehnte eine Stellungnahme ab .
Wenn große Technologiefirmen „Open-Source“-KI-Projekte auf ihre kommerziellen Interessen ausrichten, wird es für kleinere Unternehmen schwieriger, im Wettbewerb zu bestehen, und viele werden an Technologien gebunden, die von den größten Anbietern kontrolliert werden – ein Problem, das beim Cloud Computing bereits besteht. Diese zusätzlichen Einschränkungen sind bei Open Source nicht normal und könnten letztendlich dazu beitragen, dass die größten Technologieunternehmen ihre Dominanz behaupten.
Open-Source-KI wird im Jahr 2024 große Fortschritte machen, aber auch Big Tech könnte davon mehr profitieren, als wir vielleicht erwarten.
(1) In der Lizenz von Ferret schränkt Apple die Verwendung seines Namens und Logos bei der Werbung für Produkte ein, die mit der Software erstellt wurden, und bietet keine Garantie für Patentrechte, was ein gewisses rechtliches Risiko für Entwickler birgt