合成技術
- 技術-Technology

Make-A-Video - MetaのAI研究開発チームによるテキストからビデオを生成する技術が発表！

投稿日 2022-09-30
更新日 2022-09-30
合成技術技術-Technology
AI Make-A-Video Meta Meta AI
0

この記事は約2分5秒で読めます

Meta AIによる、テキストプロンプトから動画を生成する技術「Make-A-Video」が発表されました。

プロモーション

Make-A-Video

We’re pleased to introduce Make-A-Video, our latest in #GenerativeAI research! With just a few words, this state-of-the-art AI system generates high-quality videos from text prompts.

Have an idea you want to see? Reply w/ your prompt using #MetaAI and we’ll share more results. pic.twitter.com/q8zjiwLBjb
— Meta AI (@MetaAI) September 29, 2022

Make-A-Videoの研究は、テキストからビデオへの生成を可能にするために構築されたテキストから画像への生成技術における最近の進歩をベースにしています。このシステムは、説明文付きの画像を用いて、世界がどのように見えるか、また、どのように説明されることが多いかを学習します。また、ラベルのない動画を使って、世界の動きを学習します。このデータをもとに、Make-A-Videoは、わずかな文字や行のテキストで、気まぐれで世界にひとつだけの動画を生成し、あなたの想像力を膨らませます。
公式ページより

私たちは、Text-to-Image（T2I）生成における最近の驚異的な進歩を、Text-to-Video（T2V）に直接変換するアプローチであるMake-A-Videoを提案します。我々の直感は単純で、テキストと画像のペアデータから、世界がどのように見えるか、どのように記述されるかを学び
このように、Make-A-Videoは、テキストと画像のペアから世界の様子とその説明を学習し、教師なしビデオ映像から世界の動きを学習する。Make-A-Videoには、
（1）T2Vモデルの学習を高速化できる（視覚表現とマルチモーダル表現を一から学習する必要がない）
（2）教師なしビデオ映像から世界の動きを学習できテキストとビデオのペアデータを必要としない、
（3）生成されたビデオは今日の画像生成モデルの持つ広大さ（美的感覚の多様性、幻想的な描写など）を継承している
という三つの利点があります。
我々は、T2Iモデルに新規かつ効果的な空間-時間モジュールを構築するための、シンプルかつ効果的な方法を設計する。まず、完全な時間的U-Netと注意テンソルを分解し、空間と時間で近似する。次に、T2V以外の様々なアプリケーションを可能にするビデオデコーダ、補間モデル、2つの超解像モデルにより、高解像度かつフレームレートのビデオを生成する空間時間パイプラインを設計する。空間的・時間的解像度、テキストへの忠実性、品質、すべての側面において、Make-A-Videoは質的にも量的にも、テキストからビデオへの生成における新しい最先端を打ち立てたと言える。
論文より

これまた凄いのが出てきましたね。「Make-A-Video」は現在論文のみ公開済みです。
今後の動向が気になる方は、是非サイトをチェックしてみてください。

リンク

Make-A-Video

プロモーション

0 コメント
0 トラックバック

コメントをお待ちしています。

DreamFusion: Text-to-3D using 2D Diffusion - テキストプロンプトから3次元モデル（NeRF：Neural Radiance Field）を生成できる技術が登場！

2022-09-30

Blentoon Addon v1.0 - コミック調のマテリアルを手軽に適用出来るBlenderアドオンが無料公開！

2022-10-04

サイト内検索

CGWORLD vol.310 2024年6月号 - 「ローポリから始める3DC...

Lazy Bones - メッシュの形状を元に良い感じの位置に骨を配置してくれる...

Wacom Movink 13 - 超薄型＆軽量！ワコム初の有機ELペンタブレッ...

Rescue Concept ZBrush to Keyshot to Phot...

Yaw3 - 自宅で体験型VRを手軽に実現できる筐体！より軽く静音化された最新モ...

Make-A-Video - MetaのAI研究開発チームによるテキストからビデオを生成する技術が発表！

Make-A-Video

リンク

関連記事

コメント

3D人-3dnchu-

スポンサープロダクト

アーカイブ

カテゴリ

おすすめ商品Pickup

注目の記事

PR

PR

おすすめ商品Pickup

おすすめ記事