× schließen
Das OpenAI-Logo wird auf einem Mobiltelefon mit einem Bild auf einem Computermonitor angezeigt, das vom Dall-E-Text-zu-Bild-Modell von ChatGPT generiert wurde, Freitag, 8. Dezember 2023, in Boston. Der Hersteller von ChatGPT taucht jetzt in die Welt der KI-generierten Videos ein. Lernen Sie Sora kennen – den neuen Text-zu-Video-Generator von OpenAI. Das Tool, das das in San Francisco ansässige Unternehmen am Donnerstag, 16. Februar 2024, vorgestellt hat, nutzt generative künstliche Intelligenz, um auf der Grundlage schriftlicher Befehle sofort kurze Videos zu erstellen. Bildnachweis: AP Photo/Michael Dwyer, Datei
Der Hersteller von ChatGPT befasst sich jetzt mit KI-generierten Videos.
Lernen Sie Sora kennen – den neuen Text-zu-Video-Generator von OpenAI. Das Tool, das das Unternehmen aus San Francisco am Donnerstag vorstellte, nutzt generative künstliche Intelligenz, um auf der Grundlage schriftlicher Befehle sofort kurze Videos zu erstellen.
Sora ist nicht der Erste, der diese Art von Technologie vorführt. Branchenanalysten verweisen jedoch auf die hohe Qualität der bisher angezeigten Videos des Tools und stellen fest, dass seine Einführung einen bedeutenden Sprung sowohl für OpenAI als auch für die Zukunft der Text-zu-Video-Generierung insgesamt darstellt.
Doch wie alles im heutigen schnell wachsenden KI-Bereich weckt auch diese Technologie Befürchtungen hinsichtlich möglicher ethischer und gesellschaftlicher Auswirkungen. Folgendes müssen Sie wissen:
WAS IST SORA? KANN ICH ES NOCH VERWENDEN?
Sora ist ein Text-zu-Video-Generator, der mithilfe generativer KI auf der Grundlage schriftlicher Eingabeaufforderungen bis zu 60 Sekunden lange Videos erstellt. Das Modell kann auch Videos aus einem vorhandenen Standbild generieren.
Generative KI ist ein Zweig der KI, der etwas Neues schaffen kann. Beispiele hierfür sind Chatbots wie ChatGPT von OpenAI und Bildgeneratoren wie DALL-E und midjourney. Ein KI-System zum Generieren von Videos zu bekommen, ist neuer und anspruchsvoller, basiert aber zum Teil auf der gleichen Technologie.
Sora ist noch nicht für die öffentliche Nutzung verfügbar (OpenAI gibt an, mit politischen Entscheidungsträgern und Künstlern zusammenzuarbeiten, bevor das Tool offiziell veröffentlicht wird), und es gibt noch vieles, was wir nicht wissen. Aber seit der Ankündigung am Donnerstag hat das Unternehmen eine Handvoll Beispiele von Sora-generierten Videos geteilt, um zu zeigen, was es kann.
Sam Altman, CEO von OpenAI, nutzte auch X, die früher als Twitter bekannte Plattform, um Social-Media-Nutzer aufzufordern, zeitnah Ideen einzusenden. Später teilte er realistische, detaillierte Videos, die auf Aufforderungen wie „zwei Golden Retriever“ reagierten Podcasting auf einem Berggipfel “ und ein Radrennen auf dem Meer mit verschiedenen Tieren als Sportler, die Fahrräder fahren, mit Drohnenkameraansicht.“
Während von Sora generierte Videos in der Lage sind, komplexe, unglaublich detaillierte Szenen darzustellen, stellt OpenAI fest, dass es immer noch einige Schwächen gibt – darunter einige räumliche und Ursache-Wirkungs-Elemente. OpenAI fügt beispielsweise auf seiner Website hinzu: „Eine Person könnte in einen Keks beißen, aber danach weist der Keks möglicherweise keine Bissspur mehr auf.“
GIBT ES HEUTE ANDERE KI-GENERIERTE VIDEO-TOOLS?
Sora von OpenAI ist nicht das erste seiner Art. google, Meta und das Startup Runway ML gehören zu den anderen Unternehmen, die eine ähnliche Technologie demonstriert haben.
Dennoch betonen Branchenanalysten die scheinbare Qualität und die beeindruckende Länge der bisher geteilten Sora-Videos. Fred Havemeyer, Leiter der US-amerikanischen KI- und Softwareforschung bei Macquarie, sagte, dass die Einführung von Sora einen großen Fortschritt für die Branche darstellt.
„Man kann nicht nur längere Videos machen, ich verstehe bis zu 60 Sekunden, sondern die erstellten Videos sehen auch normaler aus und scheinen die Physik und die reale Welt tatsächlich mehr zu respektieren“, sagte Havemeyer. „In den Video-Feeds werden nicht mehr so viele ‚Uncanny Valley‘-Videos oder Fragmente angezeigt, die … unnatürlich aussehen.“
Während es im letzten Jahr „enorme Fortschritte“ bei KI-generierten Videos gab – einschließlich der Einführung von Stable Video Diffusion im letzten November – sagte Rowan Curran, leitender Analyst bei Forrester, dass solche Videos für die Charakter- und Szenenkonsistenz stärker „zusammengefügt“ werden müssten.
Die Konsistenz und Länge von Soras Videos stellen jedoch „neue Möglichkeiten für Kreative dar, Elemente von KI-generierten Videos in traditionellere Inhalte zu integrieren und jetzt sogar aus einer oder mehreren Eingabeaufforderungen vollständige Erzählvideos zu erstellen“, sagte Curran gegenüber The Associated Press per E-Mail am Freitag.
WAS SIND DIE POTENZIELLEN RISIKEN?
Obwohl Soras Fähigkeiten Beobachter seit dem Start am Donnerstag in Erstaunen versetzt haben, bestehen auch weiterhin Bedenken hinsichtlich der ethischen und gesellschaftlichen Auswirkungen der Verwendung von KI-generierten Videos.
Havemeyer weist beispielsweise auf die erheblichen Risiken im potenziell angespannten Wahlzyklus 2024 hin. Eine „potenziell magische“ Möglichkeit, Videos zu erstellen, die realistisch aussehen und klingen, wirft eine Reihe von Problemen innerhalb der Politik und darüber hinaus auf, fügte er hinzu – und verwies auf Bedenken hinsichtlich Betrug, Propaganda und Fehlinformationen.
„Die negativen externen Effekte generativer KI werden im Jahr 2024 ein entscheidendes Diskussionsthema sein“, sagte Havemeyer. „Es handelt sich um ein erhebliches Problem, mit dem sich jedes Unternehmen und jeder Mensch in diesem Jahr auseinandersetzen muss.“
Technologieunternehmen haben immer noch das Sagen, wenn es um die Kontrolle von KI und ihren Risiken geht, während Regierungen auf der ganzen Welt daran arbeiten, aufzuholen. Im Dezember hat die Europäische Union eine Einigung über die weltweit ersten umfassenden KI-Regeln erzielt, das Gesetz wird jedoch erst zwei Jahre nach der endgültigen Genehmigung in Kraft treten.
Am Donnerstag teilte OpenAI mit, dass es wichtige Sicherheitsmaßnahmen ergreift, bevor es Sora allgemein verfügbar macht.
„Wir arbeiten mit Red-Teamern zusammen – Fachexperten in Bereichen wie Fehlinformationen, hasserfüllte Inhalte und Voreingenommenheit – die das Modell kontrovers testen werden“, schrieb das Unternehmen. „Wir entwickeln außerdem Tools zur Erkennung irreführender Inhalte, beispielsweise einen Erkennungsklassifikator, der erkennen kann, wann ein Video von Sora erstellt wurde.“
Anna Makanju, Vizepräsidentin für globale Angelegenheiten bei OpenAI, bekräftigte dies, als sie am Freitag auf der Münchner Sicherheitskonferenz sprach, wo OpenAI und 19 weitere Technologieunternehmen sich verpflichteten, freiwillig zusammenzuarbeiten, um KI-generierte Wahl-Deepfakes zu bekämpfen. Sie bemerkte, dass das Unternehmen Sora „auf eine Art und Weise veröffentlichte, die recht vorsichtig ist“.
Gleichzeitig hat OpenAI nur begrenzte Informationen darüber preisgegeben, wie Sora gebaut wurde. Im technischen Bericht von OpenAI wurde nicht offengelegt, welche Bild- und Videoquellen zum Training von Sora verwendet wurden – und das Unternehmen reagierte am Freitag nicht sofort auf die Anfrage von Associated Press nach weiteren Kommentaren.
Die Sora-Veröffentlichung erfolgt auch vor dem Hintergrund von Klagen einiger Autoren und der New York Times gegen OpenAI und seinen Geschäftspartner Microsoft wegen der Verwendung urheberrechtlich geschützter Werke zum Trainieren von ChatGPT. OpenAI zahlt eine nicht genannte Gebühr an The Associated Press für die Lizenzierung seines Textnachrichtenarchivs.
© 2024 The Associated Press. Alle Rechte vorbehalten. Dieses Material darf ohne Genehmigung nicht veröffentlicht, ausgestrahlt, umgeschrieben oder weitergegeben werden.