Forscher der Universität Oxford, der Australian National University und der Beijing Academy of Artificial Intelligence haben ein neues KI-System namens „3D-GPT“ entwickelt, das 3D-Modelle aus textbasierten Beschreibungen eines Benutzers generieren kann.
Die Geschichte, die von aufgegriffen wurde VentureBeatbeschreibt das System, veröffentlicht am arXiv ursprünglich, was im Vergleich zu herkömmlichen 3D-Modellierungsworkflows eine effizientere und intuitivere Möglichkeit zum Erstellen von 3D-Inhalten bietet.
3D-GPT ist in der Lage, „prozedurale 3D-Modellierungsaufgaben in zugängliche Segmente zu zerlegen und für jede Aufgabe den passenden Agenten zu ernennen“, heißt es in dem Papier. Es verwendet mehrere KI-Agenten, die sich auf einen anderen Teil des Verständnisses der Textaufforderung konzentrieren, um Modellierungsfunktionen auszuführen.
Die Anwendung könnte bedeutende Anwendungen in der virtuellen Produktion haben, wo die Erstellung von Hintergründen und Umgebungen viel zeitaufwändigen Aufwand erfordert.
Das System wurde anhand von Aufforderungen wie „einem nebligen Frühlingsmorgen, an dem taubedeckte Blumen eine üppige Wiese umgeben von knospenden Bäumen sprengen“ getestet. 3D-GPT war in der Lage, vollständige 3D-Szenen mit realistischen Grafiken zu generieren, die die im Text beschriebenen Elemente genau widerspiegelten.
3D-GPT umfasst drei zentrale Agenten: Task-Dispatch-Agent, Konzeptualisierungsagent und Modellierungsagent. Gemeinsam verfolgen sie zwei wesentliche Ziele. Erstens verbessert es systematisch prägnante anfängliche Szenenbeschreibungen, entwickelt sie zu komplizierten Formen und passt den Text auf der Grundlage nachfolgender Anweisungen dynamisch an. Zweitens integriert es nahtlos die prozedurale Generierung und extrahiert Parameterwerte aus angereichertem Text, um mühelos eine Schnittstelle zu 3D-Software für die Asset-Erstellung herzustellen.