Meta hat einige große KI-Ambitionen, auch wenn es den Anschein hat, als würde es schon lange OpenAI, Microsoft und Co. aufholen sogar Google. Um ein bisschen Aufsehen zu erregen, zeigte das Unternehmen am Mittwoch sein neues KI-basiertes Segment Anything Model, das überraschend fähig ist Identifizieren und Trennen bestimmter Objekte in Bildern und Videos. Hier ist der Kicker, Meta gibt es für jedermann frei, indem es seine neue Software Open Source macht.

Es gibt ziemlich viele Gute Apps zum Löschen unerwünschter Objekte aus Bildern, und alle verwenden bereits KI-Modelle, um Objekte in Fotos zu finden und zu ersetzen. In meinen eigenen Tests der Segment Anything-Demoist Meta mit einem eigenen Angebot noch einen Schritt weiter gegangen. Das Demo-System bietet eine Art Photoshops „Zauberstab“-Tool auf Steroiden. Ich habe es mit ein paar überfüllten Bildern ausprobiert, z. B. einem Foto von Legos riesiges Bruchtal-Set. Es hat nicht nur kollektiv erraten, dass ich versucht habe, bestimmte Minifiguren aus dem Hintergrund auszuwählen, sondern als es ein paar eigensinnige Pixel aufgenommen hat, konnte ich ihm schnell sagen, dass es alles löschen soll, was keine ist Herr der Ringe Zeichen mit nur einem Klick.

Nach der Berechnung eines neuen Bildes leistet das System solide Arbeit, indem es verschiedene Objekte in einem Foto hervorhebt. Auf einem Bild von Ich selbst sitze in einem extrem engen Massagestuhl, konnte es mich, den Stuhl und sogar meinen Bart einzeln identifizieren. Natürlich ist Meta nicht der Einzige, der maschinelle Lernalgorithmen entwickelt, um Aspekte von Bildern zu identifizieren. Apple hat darüber gesprochen KI-Bildsegmentierungstechnologie seit 2021.

Siehe auch  Netflix bestellt „Horizon Zero Dawn“-Serie „God of War“ bei Amazon

Aber was Meta auszeichnen könnte, ist sowohl die Funktion als auch die Benutzerfreundlichkeit. In meinen eigenen Tests habe ich festgestellt, dass SAM sogar besser darin ist, kleine Objekte aus überfüllten Fotos auszuwählen als Googles Magic Eraser oder das kostenlose Online-Tool Inpaint, obwohl es keine Funktion zum Entfernen von Aspekten eines Fotos und Ersetzen seines Hintergrunds gibt.

Laut Meta ist SAM in der Lage, mehrere Masken auszugeben, selbst wenn das Objekt „mehrdeutig“ ist. Schon damals beschrieb das Unternehmen dies als nur ein „Grundlagenmodell“, das für die Bildsegmentierung nützlich ist, sowohl interaktiv als auch automatisch. Das System wird als „aufforderungsfähig“ beschrieben, was bedeutet, dass es Eingaben wie den Blick des Benutzers in einem VR-Headset oder durch Klicks und sogar Text empfangen kann.

Am überraschendsten von Meta ist vielleicht, dass es SAM unter einer offenen Lizenz veröffentlicht und weiter anbietet vollständige Details zu seinem 1-Milliarden-Maskendatensatz, von dem das Unternehmen behauptete, es sei „der größte Segmentierungsdatensatz aller Zeiten“. Dieser SA-1B ist ein semantische Segmentierung Datensatz, der jedes Pixel in einem Bild klassifiziert und es einfacher macht, Objekte aus Fotos zu stilisieren oder zu entfernen. Das System selbst wird laut Meta auf 11 Millionen Bildern mit durchschnittlich 100 Masken pro Bild trainiert.

Entsprechend Metas Forschungsbericht zu SAM, verwendete der Datensatz Bilder „von einem Anbieter, der direkt mit Fotografen zusammenarbeitet“, obwohl nicht angegeben wurde, um welchen Anbieter es sich handelte. Einige dieser Bilder, mit denen das System trainiert wurde, enthielten Gesichter und Nummernschilder, obwohl die Zeitung sagt, Meta habe diese bei der Veröffentlichung des Datensatzes unkenntlich gemacht.

Siehe auch  Elon Musks Starlink kann jetzt WLAN zu Autos, Booten und Flugzeugen übertragen

Es ist großartig zu sehen, dass Meta bereit ist, eines seiner Modelle und Daten als Open Source zu veröffentlichen, obwohl es nicht so ist, als sollten wir viel mehr Dinge kostenlos erwarten. Meta hat kürzlich einen harten Pivot gemacht KIso sehr, dass der Leiter der Metaverse-Abteilung des Unternehmens, Andrew Bosworth, und andere Führungskräfte darüber sprechen, wie das Unternehmen generative KI für verwenden will Anzeigen erstellen neben anderen kommerziellen Produkten. Das Unternehmen arbeitet noch an einer Veröffentlichung für seine ChatGPT-Konkurrent namens LLaMAobwohl es bereits online durchgesickert war.

Sicher, SAM könnte entweder in einer AR- oder VR-Fähigkeit verwendet werden, um Objekte durch den Blick eines Benutzers zu identifizieren, etwas, das ist ziemlich wichtig für Metas Ambitionen für seine AR-Headsets und -Brillen. Es gibt noch viel Raum für Missbrauch. Das KI-Erkennungssystem DeepMind von Google hat sich in Krebszellen erkennen, aber ähnliche Systeme wurden für die Gesichtserkennung verwendet. Das hat die ACLU kürzlich enthüllt Das FBI hatte jahrelang Gesichtserkennungssoftware an US-Bürgern getestet. Da diese Technologie immer ausgefeilter wird, brauchen die USA dringend a föderales Gesichts- und biometrisches Verbot oder ganz zumindest mehr Verordnung.

Möchten Sie mehr über KI, Chatbots und die Zukunft des maschinellen Lernens erfahren? Schauen Sie sich unsere vollständige Berichterstattung über an künstliche Intelligenzoder stöbern Sie in unseren Leitfäden zu Die besten kostenlosen KI-Kunstgeneratoren, Die besten ChatGPT-Alternativen, Und Alles, was wir über ChatGPT von OpenAI wissen.

4.7/5 - (192 votes)
Anzeige

Kommentieren Sie den Artikel

Bitte geben Sie Ihren Kommentar ein!
Bitte geben Sie hier Ihren Namen ein