Das Papier „Smooth-Swap: A Simple Enhancement for Face-Swapping with Smoothness“ des Unternehmens, das einen weiteren wichtigen Meilenstein in der Face-Swapping-Forschung von Kakao Brain darstellt, wird auf der bevorstehenden globalen Computer-Vision-Konferenz CVPR 2022 vorgestellt[2], im zweiten Jahr in Folge. Dazu gehört eine exklusive mündliche Präsentationssitzung, die den herausragendsten Beiträgen unter den akzeptierten Artikeln vorbehalten ist (25,33 % von 8.161 Einreichungen wurden in diesem Jahr angenommen). Bei der letztjährigen Veranstaltung hatten nur 4 % der akzeptierten Beiträge Zeit für eine mündliche Präsentation, in der Kakao Brain für seine außergewöhnliche Forschungsarbeit „HOTR: End-to-End Human-Object Interaction Detection with Transformers“ nominiert wurde. In diesem Jahr ist es „Smooth-Swap“ nicht nur gelungen, die Komplexität seiner Architektur erheblich zu reduzieren, sondern es besitzt auch ein großes Kommerzialisierungspotenzial, was beide von der führenden Computer Vision Conference anerkannt und belohnt wurden.

Ein genauer und konsistenter Identitätsgradient[3] ist unerlässlich, um die Identität einer Person nahtlos zu ändern, ohne die hohe Qualität des Bildes zu beeinträchtigen. Durch überwachten Kontrastverlust trainiert, erhält „Smooth-Swap“ seinen stabilen Identitätsgradienten durch das Erlernen der Einbettung mit einer höheren Glätte. Diese Verbesserungen adressieren die Schwäche des früheren Modells, handgefertigte Komponenten und 3D-Gesichtsmodellierung hinzuzufügen, was letztendlich sein Design komplizierte und eine ausgeklügelte Hyperparameter-Abstimmung nach sich zog. Stattdessen stützt sich „Smooth-Swap“ auf eine einfache U-Net-basierte Architektur mit einem integrierten Smooth Identity Embedder, um Spitzenleistung zu liefern.

Die einfache Architektur und verbesserte Leistung von „Smooth-Swap“ haben die Technologie nicht nur hinsichtlich ihres Kommerzialisierungspotenzials und ihrer breiteren Anwendung konkurrenzfähig gemacht, sondern ermöglichen ihr auch, anspruchsvollere Face-Swapping-Szenarien wie Face-Swapping während der Videowiedergabe zu bewältigen. „Smooth-Swap“ schlägt einen differenzierten Ansatz zur Einbettung von Identitäten vor und ermöglicht dem Generator, qualitativ hochwertigere Bilder zu erstellen, insbesondere wenn die Gesichtsform einer Person geändert wird. Durch „Smooth-Swap“ von Kakao Brain, das einen schnellen und stabilen Gesichtswechsel ermöglicht, sollen verschiedene Arten von digitalen Menschen wie virtuelle Influencer, Show-Moderatoren und Ansager entwickelt werden.

Siehe auch  Metaverse soll Industrien verbessern - chinadaily.com.cn

„Wir sind stolz und aufgeregt, der Welt die bahnbrechende Face-Swap-Technologie ‚Smooth-Swap‘ vorzustellen“, sagte Kim Il-doo, CEO von Kakao Brain. „Ich bin fest davon überzeugt, dass diese Technologie die Innovation im Bereich des Face-Swapping beschleunigen und uns dem unglaublich immersiven Metaversum, von dem wir immer geträumt haben, sowie den digitalen Human Services der Zukunft einen weiteren Schritt näher bringen wird.“

Über Kakao Brain

Kakao Brain ist ein weltweit führendes KI-Unternehmen mit beispiellosen KI-Technologien und Forschungs- und Entwicklungsnetzwerken. Das Unternehmen wurde 2017 von Kakao gegründet, um einige der größten „undenkbaren Fragen“ der Welt mit Lösungen zu lösen, die durch seine lebensstilverändernden KI-Technologien ermöglicht werden. Kakao Brain treibt ständig Innovationen in der Welt der Technologie voran und hat zahlreiche bahnbrechende KI-Dienste und -Modelle entwickelt, die die Lebensqualität Tausender von Menschen verbessern sollen, darunter minDALL-E, KoGPT, CLIP/ALIGN und RQ-Transformer. Als globaler Pionier der KI hat Kakao Brain die Verantwortung, eine lebendige Tech-Community und ein robustes F&E-Ökosystem zu fördern, während es seine Mission erfüllt, neue Technologiemärkte mit endlosem Potenzial zu schaffen. Für weitere Informationen besuchen Sie https://KakaoBrain.com/.

[1] Identitätseinbettung ist eine Vektordarstellung eines Gesichtsbildes, das zum Vergleichen von Identitäten verwendet wird. Wenn die Repräsentationsvektoren (oder Einbettungsvektoren) zweier Gesichter nahe genug beieinander liegen, werden ihre Identitäten als gleich angesehen.

[2] CVPR (Konferenz zu Computer Vision und Mustererkennung)die seit 1983 gemeinsam vom Institute of Electrical and Electronics Engineers (IEEE) und der Computer Vision Foundation (CVF) gesponsert wird, gilt neben der European Conference on Computer Vision (ECCV) als eine der anerkanntesten jährlichen Konferenzen im Bereich Computer Vision ) und International Conference on Computer Vision (ICCV).

[3] Der Identitätsgradient ist ein Lernsignal, das dem Gesichtstauschmodell mitteilt, welcher Teil abgestimmt werden muss, um die Identität der Person genau zu ändern.

Siehe auch  Roblox, der König der Metaverse, hat sein Mojo verloren

QUELLE Kakao Gehirn

Rt

⬅ Bewerten Sie post
Anzeige

Kommentieren Sie den Artikel

Bitte geben Sie Ihren Kommentar ein!
Bitte geben Sie hier Ihren Namen ein