OpenAIは2月15日(現地時間)、テキストプロンプトから最長1分の動画を生成するAIモデル「Sora」を発表し、そのクオリティの高さが話題となっています。
現在一部のビジュアルアーティストやデザイナー、映画製作者のみアクセスが許可されているそうですが、一般にはまだ公開されていません。
OpenAIのサイト内でサンプル動画がいくつか紹介されていました。↓↓
プロンプト:スタイリッシュな女性が、暖かく輝くネオンとアニメーションの街の看板で満たされた東京の通りを歩いています。彼女は黒い革のジャケット、赤い長いドレス、黒いブーツを着ており、黒い財布を持っています。彼女はサングラスと赤い口紅をつけています。彼女は自信を持って何気なく歩いています。通りは湿っていて反射しており、色とりどりの光の鏡効果を生み出しています。多くの歩行者が歩き回っています。
OpenAI
プロンプト: アニメーション シーンには、溶けた赤いキャンドルの横にひざまずいている背の低いふわふわしたモンスターのクローズ アップが表示されます。アート スタイルは 3D でリアルで、照明とテクスチャに重点を置いています。怪物が大きな目と開いた口で炎を見つめていることから、この絵の雰囲気は驚きと好奇心のひとつです。そのポーズと表情は、まるで初めて自分の周りの世界を探検しているかのような、無邪気さと遊び心の感覚を伝えます。温かみのある色と劇的な照明の使用により、画像の居心地の良い雰囲気がさらに高まります。
OpenAI
プロンプト:ビッグ サーのガライ ポイント ビーチ沿いの険しい崖に打ち寄せる波をドローンで撮影した映像。打ち寄せる青い水が白い波を生み出し、夕日の金色の光が岩場の海岸を照らします。灯台のある小さな島が遠くにあり、緑の植え込みが崖の端を覆っています。道路からビーチまでの急な下り坂は劇的なもので、崖の端が海に突き出ています。これは、海岸のありのままの美しさとパシフィック コースト ハイウェイの険しい風景を捉えた眺めです。
OpenAI
プロンプト: 中に禅の庭があるガラス球の拡大図。球体の中には小さな小人がいて、禅庭をかき集めて砂に模様を作っています。
OpenAI
すごくないですか??かなりのクオリティです。ところどころ看板の日本語がおかしかったりもしますが、これが生成AIでテキストから作られたものだということに驚きです。
今までも動画生成AIはありましたが、まだ数秒程度と短いものしか生成できませんでした。
しかしSoraは最長1分の動画生成を可能にし、さらには、16:9、正方形、縦型といった様々なアスペクト比での出力にも対応しています。
また、DALL・E画像をアニメーション化したり、動画同士を接続してループ動画にしたり、拡張したり、幅広い編集タスクも実行できるようになるそうです。
公開されたら是非使ってみたいですね。
▼テクニカルレポート
https://openai.com/research/video-generation-models-as-world-simulators