Wir haben bereits funktionierende Roboter. Wir verfügen über KI-Tools, die beliebige Informationen schreiben oder präsentieren können. Jetzt haben wir OpenAI SORA, das KI-generierte Videos ins Leben gerufen hat. Sollten wir also damit rechnen, dass Roboter aufgrund der starken KI-Entwicklung bald die Macht übernehmen werden? Hoffentlich nicht, aber Sam Altman hat ein weiteres Super-KI-Tool entwickelt, also sprechen wir über das neue Produkt von OpenAI, SORA.
Verständnis der OpenAI SORA-Technologie
OpenAI hat uns zuvor chatgpt vorgestellt, was für alle eine große Hilfe war. Diesmal ist es einen Schritt voraus, da jetzt die Videogenerierung möglich ist OpenAI SORA.
SORA, ein japanisches Wort, das HIMMEL bedeutet, ist die weltweit erste KI-Technologie, die realistische Videos erstellt. Diese Videos sind bis zu 1 Minute lang und alle Bilder wirken echt. SORA kann den Zusammenhalt zwischen Frames aufrechterhalten und Bilder können in unterschiedlichen Seitenverhältnissen gerendert werden. Für SORA hat Sam mit verschiedenen Grafikdesignern, bildenden Künstlern und Designern zusammengearbeitet, um Feedback zur Leistung von SORA im Laufe der Zeit zu erhalten.
Diese Nachricht kam am 15. Februar, als Sam dies auf seinem persönlichen X-Konto postete. Darüber hinaus übertrug er die Arbeit und Funktionsweise von SORA live vor Tausenden von Zuschauern auf der Plattform. Er entwarf vor der Kamera Szenarien wie „Zwei Hunde machen Podcasts auf dem Gipfel des Berges, fliegendes Eichhörnchen auf einem Drachen“, um die KI-Leistung von SORA zu demonstrieren.
Technische Merkmale von SORA
SORA kann 275 Videos mit einer Länge von bis zu 1 Minute generieren, entweder durch eine Textaufforderung oder ein Bild als Referenz, und füllt es mit Bewegung.
Offene Modelle wie Video Diffusion und ein privates Produkt namens PIKA gibt es bereits, aber SORA hat mit seiner besseren Technologie alles übernommen. Es ähnelt dem Diffusionsmodell DALL-E, das mit der Erzeugung zufälliger Geräusche beginnt und diese Geräusche dann schrittweise in kohärente Bilder aktualisiert.
Ein einzelnes Bild besteht aus Tonnen von Daten, etwa 1000 x 1000 Pixel in drei Farbfeldern, was Millionen von Datenpunkten entspricht. Die von SORA erstellten Videos sind 1 Minute lang und mit mehreren Zeitrahmen werden die Datenpunkte riesig sein. Diese Daten werden Patches genannt und ähneln den Token, die in ChatGPT als Dateneinheiten verwendet werden.
SORA tokenisiert keine Texte. Stattdessen werden sie als visuelle Patches betrachtet, bei denen es sich um kleine komprimierte Bildblöcke handelt, die die Visualisierung und zeitliche Bewegung einzelner Frames erfassen.
Das Besondere an SORA ist, dass es die Trainingsdaten und -ausgaben nicht für eine bestimmte Zeit und Auflösung zuschneidet, wie es bei anderen Trainingsmodellen der Fall ist. Stattdessen werden Daten auf ihre native Auflösung und die Auflösungen der Ausgabevariablen trainiert.
OpenAI hat behauptet, dass SORA komplexe Szenen erzeugen kann, die mehrere Charaktere und jede Art von Bewegung enthalten können und gleichzeitig Details zu Hintergrund und Motiv liefern. Und schließlich kann es jedes Video erweitern, indem es fehlende Frames ausfüllt.
Einschränkungen von SORA
SORA ist eine großartige Technologie, und die Benutzer müssen warten, bis sie sie nutzen können. Aber das ist zumindest im Moment nicht möglich. SORA ist für Menschen nicht zugänglich, da es missbraucht werden kann. Das Unternehmen hat es nur zu Forschungszwecken auf bestimmte Personen beschränkt. Unter anderen Umständen, wenn es öffentlich wird, verfügt es über C2PA-Metadaten. Dabei handelt es sich um einen Überwachungsapparat, der alle Einträge aufzeichnet, etwa woher der Inhalt stammt und alle Änderungen.
OpenAI SORA weist einige massive Mängel auf. Die erstellten Videos sind von guter Qualität, verfügen jedoch über einen deutlichen KI-Touch, der sie von von Menschen erstellten Videos unterscheiden kann. Abgesehen davon hat es die Physik und humanoiden Interaktionen nicht perfekt modelliert.
Außerdem ist SORA nicht kosteneffektiv. Es erfordert enorme Rechenleistung. Sam Altman bat sein Publikum um 7 Billionen Dollar an Fördermitteln für den Kauf einiger GPUS, um mehr Rechenleistung zu erhalten. Was später viele Trolle erhielt, unter anderem von NVIDIA-CEO Jensen Huang.
Abschluss
OpenAI SORA hat den Markt übernommen, da jeder es in die Hände bekommen möchte. Es wurden viele nützliche Funktionen eingeführt, die beim Erstellen und Bearbeiten von Videos Zeit sparen. Das OpenAI-Team hat darüber gesprochen, bald weitere Updates bereitzustellen und an der Einschränkung zu arbeiten. Es ist an der Zeit zu sehen, was uns danach noch in der Entwicklung der KI zu sehen bleibt. Lesen Sie, wie der Wert von OpenAI nach SORA gestiegen ist.
Der präsentierte Inhalt kann die persönliche Meinung des Autors beinhalten und unterliegt den Marktbedingungen. Machen Sie Ihre Marktforschung, bevor Sie in Kryptowährungen investieren. Der Autor oder die Veröffentlichung übernehmen keine Verantwortung für Ihren persönlichen finanziellen Verlust.
✓ Teilen: