Von WYATTE GRANTHAM-PHILIPS und MATT O'BRIEN
NEW YORK (AP) – Der Hersteller von chatgpt beschäftigt sich jetzt mit KI-generierten Videos.
Lernen Sie Sora kennen – OpenAIs neuer Text-zu-Video-Generator. Das Tool, das das Unternehmen aus San Francisco am Donnerstag vorstellte, nutzt generative künstliche Intelligenz, um auf der Grundlage schriftlicher Befehle sofort kurze Videos zu erstellen.
Sora ist nicht der Erste, der diese Art von Technologie vorführt. Branchenanalysten verweisen jedoch auf die hohe Qualität der bisher angezeigten Videos des Tools und stellen fest, dass seine Einführung für beide einen bedeutenden Sprung darstellt OpenAI und die Zukunft der Text-zu-Video-Generierung insgesamt.
Doch wie alles im heutigen schnell wachsenden KI-Bereich weckt auch diese Technologie Befürchtungen hinsichtlich möglicher ethischer und gesellschaftlicher Auswirkungen. Folgendes müssen Sie wissen:
Sora ist ein Text-zu-Video-Generator, der mithilfe generativer KI Videos mit einer Länge von bis zu 60 Sekunden basierend auf schriftlichen Eingabeaufforderungen erstellt. Das Modell kann auch Videos aus einem vorhandenen Standbild generieren.
Generative KI ist ein Zweig der KI, der etwas Neues schaffen kann. Beispiele hierfür sind Chatbots wie ChatGPT von OpenAI und Bildgeneratoren wie DALL-E und midjourney. Ein KI-System zum Generieren von Videos zu bekommen, ist neuer und anspruchsvoller, basiert aber zum Teil auf der gleichen Technologie.
Sora ist noch nicht für die öffentliche Nutzung verfügbar (OpenAI gibt an, mit politischen Entscheidungsträgern und Künstlern zusammenzuarbeiten, bevor das Tool offiziell veröffentlicht wird), und es gibt noch vieles, was wir nicht wissen. Aber seit der Ankündigung am Donnerstag hat das Unternehmen eine Handvoll Beispiele von Sora-generierten Videos geteilt, um zu zeigen, was es kann.
OpenAI-CEO Sam Altman nutzte auch X, die Plattform, die früher als Twitter bekannt war, und forderte Social-Media-Nutzer auf, zeitnah Ideen einzusenden. Später teilte er realistisch detaillierte Videos, die auf Aufforderungen wie „zwei Golden Retriever“ reagierten Podcasting auf einem Berggipfel “ und ein Radrennen auf dem Meer mit verschiedenen Tieren als Sportler, die Fahrräder fahren, mit Drohnenkameraansicht.“
Während von Sora generierte Videos in der Lage sind, komplexe, unglaublich detaillierte Szenen darzustellen, stellt OpenAI fest, dass es immer noch einige Schwächen gibt – darunter einige räumliche und Ursache-Wirkungs-Elemente. OpenAI fügt beispielsweise auf seiner Website hinzu: „Eine Person könnte einen Keks abbeißen, aber der Keks hat danach möglicherweise keine Bissspur mehr.“
Sora von OpenAI ist nicht das erste seiner Art. google, Meta und das Startup Runway ML gehören zu den anderen Unternehmen, die eine ähnliche Technologie demonstriert haben.
Dennoch betonen Branchenanalysten die scheinbare Qualität und die beeindruckende Länge der bisher geteilten Sora-Videos. Fred Havemeyer, Leiter der US-amerikanischen KI- und Softwareforschung bei Macquarie, sagte, dass die Einführung von Sora einen großen Fortschritt für die Branche darstellt.
„Man kann nicht nur längere Videos machen, ich verstehe bis zu 60 Sekunden, sondern die erstellten Videos sehen auch normaler aus und scheinen die Physik und die reale Welt tatsächlich mehr zu respektieren“, sagte Havemeyer. „In den Video-Feeds werden nicht mehr so viele ‚Uncanny Valley‘-Videos oder Fragmente angezeigt, die … unnatürlich aussehen.“
Während es im letzten Jahr „enorme Fortschritte“ bei KI-generierten Videos gab – einschließlich der Einführung von Stable Video Diffusion im vergangenen November – sagte Rowan Curran, leitender Analyst bei Forrester, dass solche Videos für die Charakter- und Szenenkonsistenz stärker „zusammengefügt“ werden müssten.
Die Konsistenz und Länge von Soras Videos stellen jedoch „neue Möglichkeiten für Kreative dar, Elemente von KI-generierten Videos in traditionellere Inhalte zu integrieren und jetzt sogar aus einer oder mehreren Eingabeaufforderungen vollständige Erzählvideos zu erstellen“, sagte Curran gegenüber The Associated Press per E-Mail am Freitag.
Obwohl Soras Fähigkeiten Beobachter seit dem Start am Donnerstag in Erstaunen versetzt haben, bestehen auch weiterhin Bedenken hinsichtlich der ethischen und gesellschaftlichen Auswirkungen der Verwendung von KI-generierten Videos.
Havemeyer weist beispielsweise auf die erheblichen Risiken im potenziell angespannten Wahlzyklus 2024 hin. Eine „potenziell magische“ Möglichkeit, Videos zu erstellen, die realistisch aussehen und klingen, wirft eine Reihe von Problemen innerhalb der Politik und darüber hinaus auf, fügte er hinzu – und verwies auf Bedenken hinsichtlich Betrug, Propaganda und Fehlinformationen.
„Die negativen externen Effekte der generativen KI werden im Jahr 2024 ein entscheidendes Diskussionsthema sein“, sagte Havemeyer. „Es handelt sich um ein erhebliches Problem, mit dem sich jedes Unternehmen und jeder Mensch in diesem Jahr auseinandersetzen muss.“
Technologieunternehmen haben immer noch das Sagen, wenn es um die Kontrolle von KI und ihren Risiken geht, während Regierungen auf der ganzen Welt daran arbeiten, aufzuholen. Im Dezember erzielte die Europäische Union eine Einigung darüber die weltweit ersten umfassenden KI-RegelnAber Der Akt tritt erst zwei Jahre nach der endgültigen Genehmigung in Kraft.
Am Donnerstag teilte OpenAI mit, dass es wichtige Sicherheitsmaßnahmen ergreift, bevor es Sora allgemein verfügbar macht.
„Wir arbeiten mit Red Teamern zusammen – Fachexperten in Bereichen wie Fehlinformationen, hasserfüllte Inhalte und Voreingenommenheit – die das Modell kontrovers testen werden“, schrieb das Unternehmen. „Wir entwickeln außerdem Tools zur Erkennung irreführender Inhalte, beispielsweise einen Erkennungsklassifikator, der erkennen kann, wann ein Video von Sora erstellt wurde.“
Anna Makanju, Vizepräsidentin für globale Angelegenheiten bei OpenAI, bekräftigte dies, als sie am Freitag auf der Münchner Sicherheitskonferenz sprach, wo OpenAI und 19 weitere Technologieunternehmen sich verpflichteten, freiwillig zusammenzuarbeiten, um KI-generierte Wahl-Deepfakes zu bekämpfen. Sie bemerkte, dass das Unternehmen Sora „auf eine Art und Weise veröffentlichte, die recht vorsichtig ist“.
Gleichzeitig hat OpenAI nur begrenzte Informationen darüber preisgegeben, wie Sora gebaut wurde. Im technischen Bericht von OpenAI wurde nicht offengelegt, welche Bild- und Videoquellen zum Training von Sora verwendet wurden – und das Unternehmen reagierte am Freitag nicht sofort auf die Anfrage von Associated Press nach weiteren Kommentaren.
Die Sora-Veröffentlichung erscheint ebenfalls inmitten der Hintergrund von Klagen gegen OpenAI und seinen Geschäftspartner Microsoft von einigen Autoren und Die New York Times über die Verwendung urheberrechtlich geschützter schriftlicher Werke zum Trainieren von ChatGPT. OpenAI zahlt eine nicht genannte Gebühr an The Associated Press zu lizenzieren sein Textnachrichtenarchiv.
________________
O'Brien berichtete aus Providence, Rhode Island.