Start ChatGPT Eine Text-zu-Video-KI nach ChatGPT

Eine Text-zu-Video-KI nach ChatGPT

Von

Nina Weber

Februar 17, 2024

Glücklich hide

1 Verständnis der OpenAI SORA-Technologie

1.1 Technische Merkmale von SORA

1.2 Einschränkungen von SORA

2 Abschluss

Wir haben bereits funktionierende Roboter. Wir verfügen über KI-Tools, die beliebige Informationen schreiben oder präsentieren können. Jetzt haben wir OpenAI SORA, das KI-generierte Videos ins Leben gerufen hat. Sollten wir also damit rechnen, dass Roboter aufgrund der starken KI-Entwicklung bald die Macht übernehmen werden? Hoffentlich nicht, aber Sam Altman hat ein weiteres Super-KI-Tool entwickelt, also sprechen wir über das neue Produkt von OpenAI, SORA.

Verständnis der OpenAI SORA-Technologie

Sam Altman Stellte Sora Vor

OpenAI hat uns zuvor chatgpt vorgestellt, was für alle eine große Hilfe war. Diesmal ist es einen Schritt voraus, da jetzt die Videogenerierung möglich ist OpenAI SORA.

SORA, ein japanisches Wort, das HIMMEL bedeutet, ist die weltweit erste KI-Technologie, die realistische Videos erstellt. Diese Videos sind bis zu 1 Minute lang und alle Bilder wirken echt. SORA kann den Zusammenhalt zwischen Frames aufrechterhalten und Bilder können in unterschiedlichen Seitenverhältnissen gerendert werden. Für SORA hat Sam mit verschiedenen Grafikdesignern, bildenden Künstlern und Designern zusammengearbeitet, um Feedback zur Leistung von SORA im Laufe der Zeit zu erhalten.

Diese Nachricht kam am 15. Februar, als Sam dies auf seinem persönlichen X-Konto postete. Darüber hinaus übertrug er die Arbeit und Funktionsweise von SORA live vor Tausenden von Zuschauern auf der Plattform. Er entwarf vor der Kamera Szenarien wie „Zwei Hunde machen Podcasts auf dem Gipfel des Berges, fliegendes Eichhörnchen auf einem Drachen“, um die KI-Leistung von SORA zu demonstrieren.

Siehe auch Google kündigt neue Bard-Funktionen an, um mit ChatGPT gleichzuziehen – Forbes.ua

Technische Merkmale von SORA

SORA kann 275 Videos mit einer Länge von bis zu 1 Minute generieren, entweder durch eine Textaufforderung oder ein Bild als Referenz, und füllt es mit Bewegung.

Offene Modelle wie Video Diffusion und ein privates Produkt namens PIKA gibt es bereits, aber SORA hat mit seiner besseren Technologie alles übernommen. Es ähnelt dem Diffusionsmodell DALL-E, das mit der Erzeugung zufälliger Geräusche beginnt und diese Geräusche dann schrittweise in kohärente Bilder aktualisiert.

Ein einzelnes Bild besteht aus Tonnen von Daten, etwa 1000 x 1000 Pixel in drei Farbfeldern, was Millionen von Datenpunkten entspricht. Die von SORA erstellten Videos sind 1 Minute lang und mit mehreren Zeitrahmen werden die Datenpunkte riesig sein. Diese Daten werden Patches genannt und ähneln den Token, die in ChatGPT als Dateneinheiten verwendet werden.

SORA tokenisiert keine Texte. Stattdessen werden sie als visuelle Patches betrachtet, bei denen es sich um kleine komprimierte Bildblöcke handelt, die die Visualisierung und zeitliche Bewegung einzelner Frames erfassen.

Das Besondere an SORA ist, dass es die Trainingsdaten und -ausgaben nicht für eine bestimmte Zeit und Auflösung zuschneidet, wie es bei anderen Trainingsmodellen der Fall ist. Stattdessen werden Daten auf ihre native Auflösung und die Auflösungen der Ausgabevariablen trainiert.

OpenAI hat behauptet, dass SORA komplexe Szenen erzeugen kann, die mehrere Charaktere und jede Art von Bewegung enthalten können und gleichzeitig Details zu Hintergrund und Motiv liefern. Und schließlich kann es jedes Video erweitern, indem es fehlende Frames ausfüllt.

Einschränkungen von SORA

SORA ist eine großartige Technologie, und die Benutzer müssen warten, bis sie sie nutzen können. Aber das ist zumindest im Moment nicht möglich. SORA ist für Menschen nicht zugänglich, da es missbraucht werden kann. Das Unternehmen hat es nur zu Forschungszwecken auf bestimmte Personen beschränkt. Unter anderen Umständen, wenn es öffentlich wird, verfügt es über C2PA-Metadaten. Dabei handelt es sich um einen Überwachungsapparat, der alle Einträge aufzeichnet, etwa woher der Inhalt stammt und alle Änderungen.

Siehe auch Benutzer der ChatGPT-iOS-App können jetzt auf das Internet zugreifen. Hier ist wie

OpenAI SORA weist einige massive Mängel auf. Die erstellten Videos sind von guter Qualität, verfügen jedoch über einen deutlichen KI-Touch, der sie von von Menschen erstellten Videos unterscheiden kann. Abgesehen davon hat es die Physik und humanoiden Interaktionen nicht perfekt modelliert.

Außerdem ist SORA nicht kosteneffektiv. Es erfordert enorme Rechenleistung. Sam Altman bat sein Publikum um 7 Billionen Dollar an Fördermitteln für den Kauf einiger GPUS, um mehr Rechenleistung zu erhalten. Was später viele Trolle erhielt, unter anderem von NVIDIA-CEO Jensen Huang.

Abschluss

OpenAI SORA hat den Markt übernommen, da jeder es in die Hände bekommen möchte. Es wurden viele nützliche Funktionen eingeführt, die beim Erstellen und Bearbeiten von Videos Zeit sparen. Das OpenAI-Team hat darüber gesprochen, bald weitere Updates bereitzustellen und an der Einschränkung zu arbeiten. Es ist an der Zeit zu sehen, was uns danach noch in der Entwicklung der KI zu sehen bleibt. Lesen Sie, wie der Wert von OpenAI nach SORA gestiegen ist.

–>

Ezra Icy, der kreative Zauberer aus Phoenix, Arizona, ist auf die Erstellung magnetischer Inhalte für Web3-Marken spezialisiert. Im digitalen Bereich verbindet er nicht nur Benutzer; Er orchestriert eine Symphonie aus Gemeinschaft und menschlichen Bindungen. Verbinden Sie sich mit Ezra, indem Sie Pixel in unvergessliche Momente verwandeln und die virtuelle Landschaft in eine warme, einladende Oase der Verbindung verwandeln – nur unter [email protected]

Siehe auch Wie verwende ich ChatGPT, um ansprechende YouTube-Inhalte zu generieren?

Der präsentierte Inhalt kann die persönliche Meinung des Autors beinhalten und unterliegt den Marktbedingungen. Machen Sie Ihre Marktforschung, bevor Sie in Kryptowährungen investieren. Der Autor oder die Veröffentlichung übernehmen keine Verantwortung für Ihren persönlichen finanziellen Verlust.

5/5 - (115 votes)

Eine Text-zu-Video-KI nach ChatGPT

Verständnis der OpenAI SORA-Technologie

Technische Merkmale von SORA

Einschränkungen von SORA

Abschluss

Kommentieren Sie den Artikel Antwort abbrechen

Der neueste Trailer von Final Fantasy XVI zeigt mehr von seiner dunklen Geschichte

Softwareinvestoren müssen diese 3 Ideen (wieder) lernen, bevor sie sich mit Deep Tech beschäftigen

Verständnis der OpenAI SORA-Technologie

Technische Merkmale von SORA

Einschränkungen von SORA

Abschluss

Verwandte ArtikelMehr vom Autor

Das ChatGPT Hong Kong-Tutorial zeigt Ihnen Schritt für Schritt, wie Sie sich kostenlos registrieren, wie Sie es verwenden und wie Sie das Abonnement bezahlen

ChatGPT erklärte, was mit dem Hamster Kombat-Whitepaper nicht stimmt

Sparen Sie 80 % auf dieses AI Super Skills Bundle feat. ChatGPT, Leonardo, Midjourney und mehr

Kommentieren Sie den Artikel Antwort abbrechen

Der neueste Trailer von Final Fantasy XVI zeigt mehr von seiner dunklen Geschichte

Softwareinvestoren müssen diese 3 Ideen (wieder) lernen, bevor sie sich mit Deep Tech beschäftigen

Verwandte Artikel Mehr vom Autor