OpenAI hat heute Sora angekündigt, ein neues Text-zu-Video-Modell mit künstlicher Intelligenz (KI), das in der Lage ist, geschriebene Eingabeaufforderungen in minutenlange Videos umzuwandeln. Das neue Modell wird sich mit Unternehmen wie google messen, die es kürzlich angekündigt haben Lumiereein ähnliches Text-zu-Video-KI-Modell.
Entsprechend Forschungspapier von OpenAIDas neue Sora-Modell wird auf „textbedingten Diffusionsmodellen gemeinsam auf Videos und Bildern variabler Dauer“ trainiert, um aus textbasierten Eingabeaufforderungen hyperrealistische Videos zu generieren. Der Firma notiert dass es der KI beibringt, „die physische Welt in Bewegung zu verstehen und zu simulieren, mit dem Ziel, Modelle zu trainieren, die Menschen helfen, Probleme zu lösen, die eine Interaktion in der realen Welt erfordern.“
Außerdem wurden eine Reihe von Clips sowohl im Ankündigungsbeitrag als auch im Forschungspapier veröffentlicht, in denen das Modell vorgestellt wird. Der CEO des Unternehmens, Sam Altman, nahm sogar umgehend Anfragen von Benutzern entgegen, um die Fähigkeiten des Modells zu zeigen.
Wir möchten Ihnen zeigen, was Sora kann. Bitte antworten Sie mit Untertiteln für die Videos, die Sie sehen möchten, und wir beginnen mit der Erstellung einiger Videos!
– Sam Altman (@sama) 15. Februar 2024
OpenAI stellte außerdem fest, dass das Sora-Modell nicht für jedermann verfügbar ist, da das Unternehmen derzeit mit Red Teamern zusammenarbeitet, um die Grenzen des Modells zu testen, um die Sicherheit zu gewährleisten.
Wir werden mehrere wichtige Sicherheitsmaßnahmen ergreifen, bevor wir Sora in den Produkten von OpenAI verfügbar machen.
Wir arbeiten mit Red Teamern zusammen – Fachexperten in Bereichen wie Fehlinformationen, hasserfüllte Inhalte und Voreingenommenheit – die das Modell kontrovers testen.
— OpenAI (@OpenAI) 15. Februar 2024
Das Unternehmen arbeitet auch mit politischen Entscheidungsträgern zusammen, um „ihre Bedenken“ im Zusammenhang mit der Technologie zu verstehen. Obwohl das Modell nicht für die Öffentlichkeit zugänglich ist, sagte OpenAI, dass es das Modell einer ausgewählten Gruppe von Künstlern zur Verfügung stellen wird, um ihr Feedback zur Technologie einzuholen.
Wir gewähren außerdem Zugang zu einer Reihe von bildenden Künstlern, Designern und Filmemachern, um Feedback zu erhalten, wie das Modell so weiterentwickelt werden kann, dass es für Kreativprofis am hilfreichsten ist.
Wir teilen unsere Forschungsfortschritte frühzeitig, um mit Menschen außerhalb von OpenAI zusammenzuarbeiten und Feedback von ihnen zu erhalten und der Öffentlichkeit einen Eindruck davon zu vermitteln, welche KI-Fähigkeiten sich am Horizont abzeichnen.
Es gibt keine Informationen darüber, wann OpenAI das neue Modell der Öffentlichkeit anbieten wird und was es für die Endbenutzer kosten würde. OpenAI ist mit seinem CEO Sam Altman, der Gerüchten zufolge nach einer Investition in Höhe von 7 Billionen US-Dollar für seine Unternehmungen sucht, führend.