OpenAI の Sora: オートメーションの新時代 – 映画業界への影響?

キーポイント

テキストを動画に変換するエンジンの数がここ数週間で急増している。
GoogleとByteDanceの同様の発表に続き、OpenAIはこの分野に参入する最新のビッグテック・プレーヤーである。
同社の新しいAIビデオジェネレーター、Soraからのサンプルクリップは、ゲームを変える可能性のあるマルチショットビデオを示している。
テクノロジーが急速に進歩する中、AIが映画全体を生成できるようになるのはいつになるのだろうか?
この1年で、テキストから動画に変換するエンジンが相次いで市場に登場し、ユーザーはテキストプロンプトから短いアニメーションクリップを生成できるようになった。

グーグルがこの技術を取り入れたLumiereを発表してからわずか数週間後、OpenAIはSoraを発表した。AI開発者によって共有されたサンプルの世代は確かに印象的で、1つのビデオは1分間のアニメーションに及ぶ。テクノロジーが進化するにつれ、世界はAIが生成する映画革命の入り口に立っているのだろうか?

OpenAIがSoraでテキストからビデオへの競争に参入
AIを搭載した最初のテキストから動画への変換プラットフォームは2022年に登場した。Midjourneyのような画像生成ツールと似たようなロジックで、いわゆる拡散モデルを使用し、静止画や形のないノイズのようなものからスタートし、何度も繰り返しながら、動画がプロンプトに似てくるまで調整する。

最初の動画拡散モデルのいくつかは、Pika、Stability AI、Runwayによって開発されたが、最近になって大手テック企業がこの分野に参入してきた。

先月、TikTokのオーナーであるByteDanceはMagicVideo V2を発表し、新しい動画生成エンジンは既存の代替品よりも鮮明で高精細な出力を作成できると自慢した。

そのわずか2週間後、グーグルはLumiereを発表し、一見すると実際の映画映像のようなテキストから動画への出力を披露した。

木曜日に行われたオープンエイの発表は、ライバル企業に対するお膝元の反応だったのだろうか?おそらくそうだろうが、同社はSoraが優位に立てる可能性のある重要な機能のデモンストレーションに成功した。

Soraがマルチシーン動画生成機能を初披露
グーグルとBytedanceはともに、AIが生成する動画の品質と忠実度の飛躍的な向上を予告しているが、どちらも、単一の、通常は動かない視点からの短いクリップを出力する、既存のテキストから動画へのジェネレーターの一般的な型から脱却していない。

対照的に、Soraのプロモーションビデオには、動くカメラアングル、映画のようなカット、複数のシーンが含まれており、これらはすべて1つのプロンプトによって生成される。

OpenAIが自慢しているように、”Soraは、キャラクターやビジュアルスタイルを正確に表現するために、1つの生成されたビデオの中に複数のショットを作成することができます。”

開発は非常に重要だ。結局のところ、アニメーションがいかに巧妙であっても、既存のソリューションによって生成された動画は、高解像度のGIFに過ぎないことが多い。

AI映画への道を開く
Soraは、長時間のクリップの連続性を高めることで、AIが映画全体を生成できるようになる未来を予測している。

今のところ、OpenAIはこのプラットフォームのリリース日を発表していない。グーグルもBytedanceも、いつ利用可能になるかは明らかにしていない。

しかし、2024年まであと7週間足らずとなった今、ビッグテック企業は、映画、広告、その他の映像メディア産業におけるこの技術の変革の可能性を示す、この分野での大きな進歩を示している。

●テレグラム始めました!https://t.me/joinchat/F-7ftRCH5u_8J7k2JUM1rw●無料でLINE@で有益情報を随時流しています。https://lin.ee/1rhkgzo ●過去の記事
http://ripple.2chblog.jp/■トレードするならバイナンス!
https://www.binance.com/

■yobit net
https://yobit.net/en/