Meta verstärkt seine Bemühungen im Bereich der künstlichen Intelligenz aggressiv, um zu Konkurrenten wie google, Microsoft und OpenAI aufzuschließen. Der Social-Media-Riese hat ein neues Text-zu-Bild-Modell namens eingeführt CM3leon Es behauptet, dass es bei der Generierung von Bildern aus Texteingabeaufforderungen die modernste Leistung erbringt. Es steht jedoch noch nicht zum Testen oder zur kommerziellen Nutzung zur Verfügung.

CM3leon markiert einen Durchbruch für die KI-Fähigkeiten von Meta. Das Modell kann nicht nur hochauflösende Bilder aus Textbeschreibungen generieren, sondern auch zusammenhängende Bildunterschriften für vorhandene Bilder schreiben. Dies legt den Grundstein für fortschrittlichere Bildverständnismodelle in der Zukunft.

Meta nutzt sein hervorragendes Data-Science-Team und seine Computerinfrastruktur, um hochmoderne Modelle wie CM3leon voranzutreiben. Während diffusionsbasierte KI wie die von midjourney für Schlagzeilen gesorgt hat, setzt Meta auf autoregressive Transformatorarchitekturen (die gleiche Technologie, die auch von chatgpt verwendet wird). Das Unternehmen Ansprüche CM3leon benötigt 5x weniger Trainingsrechen als andere vergleichbare Methoden.

In direkten Vergleichen scheint CM3leon komplexe Objekte und Einschränkungen in Texteingabeaufforderungen besser zu bewältigen als Modelle wie DALL-E 2 von OpenAI und sogar Midjourney. Von Meta geteilte Bilder zeigen, dass sein neuer Text-zu-Bild-Generator in der Lage ist, die menschliche Anatomie genau darzustellen (keine Spaghetti-Hände mehr) und sogar präzisen Text wiedergeben kann (keine zufälligen Wörter mehr in KI-Bildern).

Einige Beispiele für Bilder, bereitgestellt von CM3leon. Bild: Meta

CM3leon bietet auch erweiterte Bilder, mit denen Benutzer genauere Darstellungen ihrer Ideen erstellen können: Text zu Bild, Bild zu Bild, strukturgesteuerte Bildbearbeitung, Objekt zu Bild, Segmentierung zu Bild und Super-Resolution-Upscaling sind einige Funktionen, die nicht verfügbar sind in jedem anderen Generator als der Verwendung von Stable Diffusion Kontrollnetz.

Siehe auch  Mistral AI stellt seine erste Alternative zu ChatGPT vor

Gerüchte über ein neues LLM

Berichten zufolge plant Meta Berichten zufolge auch die Veröffentlichung einer kommerziellen Version seines LLaMA-Modells in natürlicher Sprache für externe Entwickler, wie aus Quellen hervorgeht, die von Meta zitiert wurden Financial Times. Wenn dies zutrifft, können Startups und Unternehmen benutzerdefinierte Anwendungen erstellen, die auf der KI von Meta basieren, wodurch der Social-Media-Gigant in direkte Konkurrenz zu ChatGPT (OpenAI-Microsoft), Bard (Google) und Claude v2 (Anthropic-Google) tritt.

Der Fokus von Meta scheint sich in allen seinen Apps stark auf KI zu konzentrieren, obwohl das Unternehmen behauptet hat, dass es sich auch stark auf seine Metaverse-Projekte konzentriert. Anfang des Jahres richtete das Unternehmen eine eigene Abteilung für generative KI unter der Leitung des Chief Product Officer ein Chris Cox. Meta arbeitet auch an KI-Tools, die bessere Anzeigen für gezielte Nutzer generieren.

Durch Open-Sourcing-Schlüsselmodelle wie das geleakte LLaMA LLM (das weltweit größte und fortschrittlichste verfügbare Open-Source-LLM) zielt Meta darauf ab, Innovationen von Entwicklern weltweit anzukurbeln, um die Technologie zu verbessern. Dies steht im Gegensatz zum verschlossenen Ansatz von Wettbewerbern wie OpenAI. Die Monetarisierung der Meta-Modelle bleibt jedoch auf lange Sicht eine Möglichkeit.

Die Hektik der KI-Aktivitäten kommt zu einer Zeit, in der Meta mit sinkenden Aktienwerten und Kontroversen über Datenschutz und Fehlinformationen aufgrund von Aktivitäten auf Facebook zu kämpfen hat, der nach wie vor größten Plattform des Unternehmens. Mark Zuckerberg, CEO von Meta, glaubt, dass diese große Investition in generative KI mit der Vision des Unternehmens für das Metaversum übereinstimmt und neue Einnahmequellen eröffnen könnte.

Meta hat kürzlich auch Threads gestartet, einen Twitter-Klon, der ein schnelles Benutzerwachstum verzeichnet. übertrifft das, was OpenAI erreicht hat nach dem Start von ChatGPT. Es hat sich auch als geschickt darin erwiesen, Schlüsselelemente früherer Technologien zu übernehmen, sie zu verbessern und erfolgreiche Produkte zu schaffen, die ihre Konkurrenten auf dem von ihnen geschaffenen Boden fast aus dem Weg räumen.

Siehe auch  Könnte ein Bedrohungsakteur ChatGPT sozial manipulieren?

Da neue Modelle wie CM3leon eine vielversprechende Leistung zeigen, scheint Meta entschlossen zu sein, KI energisch voranzutreiben, um seine Zukunft neu zu gestalten, nachdem die Investoren von seinen Metaversum-Bemühungen unbeeindruckt waren. Das Rennen um die Führung der generativen KI hat gerade einen neuen Läufer bekommen.

4.8/5 - (157 votes)
Anzeige

Kommentieren Sie den Artikel

Bitte geben Sie Ihren Kommentar ein!
Bitte geben Sie hier Ihren Namen ein