Auch wenn der Clip auf den ersten Blick hyperrealistisch aussieht, gibt es dennoch Fehler.
Der von der Großmutter im Clip verwendete Löffel taucht scheinbar aus dem Nichts auf. Auch ein Ring an ihrer linken Hand verschwindet. Ein Nudelholz auf einem Regal scheint in einem unmöglichen Winkel balanciert zu sein, während im Hintergrund etwas zu sehen ist, das wie eine hölzerne Weinflasche aussieht.
In einem Blogbeitrag gab OpenAI zu, dass sein Modell manchmal Probleme mit der Physik oder Situationen mit mehreren Charakteren hatte, während „Tiere oder Menschen spontan auftauchen können“.
In einem anderen Clip, der eine Großmutter an ihrem Geburtstag zeigt, verziehen sich die Hände der Charaktere auf bizarre Weise und die Flammen auf der Geburtstagstorte bewegen sich nicht, als sie versucht, sie auszublasen. In einem anderen Fall explodiert ein Basketball, als er durch einen Korb geworfen wird. OpenAI sagte, die Fehler könnten zu „humorvollen Generationen“ führen.
Sora ist in der Lage, Anfragen nach Kamerawinkeln oder Videostilen zu verstehen und unheimlich realistische Aufnahmen oder Cartoon-Videos zu erstellen, die einem Pixar-Film ähneln.
Eine Beispielaufforderung, die ein realistisches Video erstellte, lautete: „Extreme Nahaufnahme des blinzelnden Auges einer 24-jährigen Frau, die während der magischen Stunde in Marrakesch steht, Kinofilm, gedreht in 70 mm.“
Die Enthüllung von Sora erfolgt inmitten eines wachsenden Interesses an KI-Tools nach der Veröffentlichung von chatgpt vor etwas mehr als einem Jahr.
Allerdings wird das Videogenerierungstool bei Künstlern, Animatoren und Filmemachern Befürchtungen hervorrufen, dass ihre Arbeitsplätze gefährdet sein könnten, und die Befürchtungen schüren, dass äußerst überzeugende „Deepfake“-Videos das Internet überschwemmen.