20. Oktober 2023
MIT-Ingenieure haben die Grenzen tiefer generativer Modelle im technischen Design aufgedeckt und die entscheidende Notwendigkeit hervorgehoben, dass KI statistische Ähnlichkeiten überwinden und Innovationen fördern muss.
Bild: Mit freundlicher Genehmigung der Forscher
chatgpt und andere tiefgreifende generative Modelle erweisen sich als unheimliche Nachahmer. Diese KI-Supermodels können Gedichte verfassen, Symphonien fertigstellen und neue Videos und Bilder erstellen, indem sie automatisch aus Millionen von Beispielen früherer Werke lernen. Diese enorm leistungsstarken und vielseitigen Tools zeichnen sich durch die Generierung neuer Inhalte aus, die alles ähneln, was sie zuvor gesehen haben.
Aber wie MIT-Ingenieure in einer neuen Studie sagen, reicht Ähnlichkeit nicht aus, wenn man bei technischen Aufgaben wirklich innovativ sein will. „Deep Generative Models (DGMs) sind sehr vielversprechend, aber auch von Natur aus fehlerhaft“, sagt Studienautor Lyle Regenwetter, ein Maschinenbaustudent am MIT.
„Das Ziel dieser Modelle besteht darin, einen Datensatz nachzuahmen. Aber als Ingenieure und Designer wollen wir oft kein Design erstellen, das bereits existiert.“
Er und seine Kollegen argumentieren, dass Maschinenbauingenieure, wenn sie Hilfe von KI benötigen, um neuartige Ideen und Designs zu generieren, diese Modelle zunächst über die „statistische Ähnlichkeit“ hinaus neu ausrichten müssen.
„Die Leistung vieler dieser Modelle hängt explizit davon ab, wie statistisch ähnlich eine generierte Stichprobe dem ist, was das Modell bereits gesehen hat“, sagt Co-Autor Faez Ahmed, Assistenzprofessor für Maschinenbau am MIT.
„Aber im Design könnte es wichtig sein, anders zu sein, wenn man innovativ sein will.“
In ihrer Studie zeigen Ahmed und Regenwetter die Fallstricke tiefer generativer Modelle auf, wenn sie mit der Lösung technischer Designprobleme beauftragt werden.
In einer Fallstudie zum Design von Fahrradrahmen zeigt das Team, dass diese Modelle letztendlich neue Rahmen hervorbringen, die frühere Designs nachahmen, aber hinsichtlich der technischen Leistung und Anforderungen ins Wanken geraten.
Als die Forscher DGMs das gleiche Fahrradrahmenproblem vorlegten, das sie speziell mit technikorientierten Zielen und nicht nur mit statistischer Ähnlichkeit entworfen hatten, produzierten diese Modelle innovativere, leistungsstärkere Rahmen.
Die Ergebnisse des Teams zeigen, dass auf Ähnlichkeiten fokussierte KI-Modelle bei der Anwendung auf technische Probleme nicht ganz anwendbar sind. Aber wie die Forscher in ihrer Studie auch hervorheben, könnten KI-Modelle bei sorgfältiger Planung aufgabengerechter Metriken ein effektiver Design-„Copilot“ sein.
„Hier geht es darum, wie KI Ingenieuren dabei helfen kann, innovative Produkte besser und schneller zu entwickeln“, sagt Ahmed. „Dazu müssen wir zunächst die Anforderungen verstehen. Das ist ein Schritt in diese Richtung.“
Ein Problem formulieren Wie Ahmed und Regenwetter schreiben, sind DGMs „leistungsstarke Lernende mit beispielloser Fähigkeit“, riesige Datenmengen zu verarbeiten. DGM ist ein weit gefasster Begriff für jedes maschinelle Lernmodell, das darauf trainiert wird, die Verteilung von Daten zu lernen und diese dann zur Generierung neuer, statistisch ähnlicher Inhalte zu verwenden.
Das äußerst beliebte ChatGPT ist eine Art tiefes generatives Modell, das als Large Language Model (LLM) bekannt ist und Funktionen zur Verarbeitung natürlicher Sprache in das Modell integriert, damit die App als Reaktion auf Konversationsanfragen realistische Bilder und Sprache generieren kann. Weitere beliebte Modelle zur Bilderzeugung sind DALL-E und Stable Diffusion.
Aufgrund ihrer Fähigkeit, aus Daten zu lernen und realistische Beispiele zu generieren, werden DGMs zunehmend in verschiedenen technischen Bereichen eingesetzt.
Designer haben tiefe generative Modelle verwendet, um neue Flugzeugrahmen, Metamaterialdesigns und optimale Geometrien für Brücken und Autos zu entwerfen. Aber zum größten Teil haben die Modelle bestehende Designs nachgeahmt, ohne die Leistung bestehender Designs zu verbessern.
„Designern, die mit DGMs arbeiten, fehlt irgendwie das Sahnehäubchen, nämlich die Anpassung des Trainingsziels des Modells an die Designanforderungen“, sagt Regenwetter.
„Am Ende generieren die Leute also Designs, die dem Datensatz sehr ähnlich sind.“
In der neuen Studie skizziert er die größten Fallstricke bei der Anwendung von DGMs auf technische Aufgaben und zeigt, dass das grundlegende Ziel von Standard-DGMs darin besteht, spezifische Designanforderungen nicht zu berücksichtigen.
Um dies zu veranschaulichen, führt das Team einen einfachen Fall des Fahrradrahmendesigns an und zeigt, dass Probleme bereits in der anfänglichen Lernphase auftreten können.
Wenn ein Modell aus Tausenden vorhandener Fahrradrahmen verschiedener Größen und Formen lernt, geht es möglicherweise davon aus, dass zwei Rahmen mit ähnlichen Abmessungen eine ähnliche Leistung aufweisen, obwohl in einem Rahmen tatsächlich eine kleine Diskrepanz vorliegt – zu klein, um als signifikanter Unterschied in der statistischen Ähnlichkeit registriert zu werden Metriken – macht den Rahmen viel schwächer als den anderen, optisch ähnlichen Rahmen.
jenseits von „Vanille“ Die Forscher führten das Fahrradbeispiel weiter, um zu sehen, welche Designs ein DGM tatsächlich generieren würde, nachdem er aus vorhandenen Designs gelernt hatte.
Sie testeten zunächst ein herkömmliches „Vanilla“-Generative-Adversarial-Network oder GAN – ein Modell, das in der Bild- und Textsynthese weit verbreitet ist und lediglich darauf abgestimmt ist, statistisch ähnliche Inhalte zu generieren.
Sie trainierten das Modell anhand eines Datensatzes von Tausenden von Fahrradrahmen, darunter kommerziell hergestellte Designs und weniger konventionelle, von Hobbyisten entworfene Einzelrahmen.
Nachdem das Modell aus den Daten gelernt hatte, forderten die Forscher es auf, Hunderte neuer Fahrradrahmen zu generieren. Das Modell erzeugte realistische Designs, die vorhandenen Rahmen ähnelten. Aber keines der Designs zeigte eine signifikante Verbesserung der Leistung, und einige waren sogar etwas schlechter, mit schwereren, weniger strukturell stabilen Rahmen.
Anschließend führte das Team den gleichen Test mit zwei anderen DGMs durch, die speziell für technische Aufgaben entwickelt wurden. Das erste Modell ist eines, das Ahmed zuvor entwickelt hat, um leistungsstarke Tragflächenkonstruktionen zu entwickeln. Er entwickelte dieses Modell, um sowohl statistische Ähnlichkeit als auch funktionale Leistung zu priorisieren. Bei der Anwendung auf die Fahrradrahmenaufgabe erzeugte dieses Modell realistische Designs, die zudem leichter und stabiler als bestehende Designs waren.
Es entstanden aber auch physikalisch „ungültige“ Rahmen, deren Komponenten nicht ganz passten oder sich auf physikalisch unmögliche Weise überlappten.
„Wir sahen Designs, die deutlich besser waren als der Datensatz, aber auch Designs, die geometrisch inkompatibel waren, weil das Modell nicht auf die Einhaltung von Designbeschränkungen ausgerichtet war“, sagt Regenwetter.
Das letzte Modell, das das Team testete, war eines, das Regenwetter gebaut hatte, um neue geometrische Strukturen zu erzeugen. Bei der Entwicklung dieses Modells wurden die gleichen Prioritäten wie bei den Vorgängermodellen verfolgt, jedoch wurden zusätzlich Designeinschränkungen berücksichtigt und physisch brauchbare Rahmen priorisiert, beispielsweise ohne Unterbrechungen oder überlappende Stangen. Dieses letzte Modell brachte die leistungsstärksten Designs hervor, die auch physikalisch realisierbar waren.
„Wir haben herausgefunden, dass ein Modell, das über die statistische Ähnlichkeit hinausgeht, Designs hervorbringen kann, die besser sind als die, die es bereits gibt“, sagt Ahmed.
„Es ist ein Beweis dafür, was KI leisten kann, wenn sie explizit auf eine Designaufgabe trainiert wird.“
Wenn beispielsweise DGMs mit anderen Prioritäten wie Leistung, Designbeschränkungen und Neuheit gebaut werden können, prognostiziert Ahmed, dass „zahlreiche technische Bereiche wie molekulares Design und zivile Infrastruktur stark davon profitieren würden.“
Indem wir die potenziellen Fallstricke beleuchten, die sich daraus ergeben, dass man sich ausschließlich auf statistische Ähnlichkeit verlässt, hoffen wir, neue Wege und Strategien für generative KI-Anwendungen außerhalb von Multimedia zu inspirieren.“