CGWORLD vol.310 2024年6月号 - 「ローポリから始める3DC...

さぁさぁ久しぶりのCGWORLD紹介ですよ。2024年5月10日発売の『CGWORLD vol.310 2024年6月号』はSNSで有名な方々によるローポリ特集!

続きを読む

Lazy Bones - メッシュの形状を元に良い感じの位置に骨を配置してくれる...

Blue Nile 3dによるBlenderアドオン『Lazy Bones』がリリースされました!メッシュの形状を元に良い感じの位置に骨を配置してくれます。

続きを読む

Wacom Movink 13 - 超薄型&軽量!ワコム初の有機ELペンタブレッ...

ワコムが初の有機EL搭載ペンタブレット『Wacom Movink 13』を発表しました!2024年5月15日発売予定です!

続きを読む

Rescue Concept ZBrush to Keyshot to Phot...

キャラクターアーティストのMarcus Whinney氏によるZBrushなどを活用した「レスキュー」のコンセプトモデリング制作タイムラプスが公開されています!

続きを読む

Yaw3 - 自宅で体験型VRを手軽に実現できる筐体!より軽く静音化された最新モ...

自宅で体験型VRを手軽に実現可能な筐体の最新モデル『Yaw3』が2024年5月に登場します!プリオーダー開始!

続きを読む

Maya 2024 | 製品概要と購入 | Autodesk 公式

Make-A-Video - MetaのAI研究開発チームによるテキストからビデオを生成する技術が発表!

この記事は約2分5秒で読めます

Meta AIによる、テキストプロンプトから動画を生成する技術「Make-A-Video」が発表されました。


プロモーション

求人情報検索 | CG・映像の専門情報サイト | CGWORLD.jp


Make-A-Video

Make-A-Videoの研究は、テキストからビデオへの生成を可能にするために構築されたテキストから画像への生成技術における最近の進歩をベースにしています。このシステムは、説明文付きの画像を用いて、世界がどのように見えるか、また、どのように説明されることが多いかを学習します。また、ラベルのない動画を使って、世界の動きを学習します。このデータをもとに、Make-A-Videoは、わずかな文字や行のテキストで、気まぐれで世界にひとつだけの動画を生成し、あなたの想像力を膨らませます。

公式ページより

私たちは、Text-to-Image(T2I)生成における最近の驚異的な進歩を、Text-to-Video(T2V)に直接変換するアプローチであるMake-A-Videoを提案します。我々の直感は単純で、テキストと画像のペアデータから、世界がどのように見えるか、どのように記述されるかを学び
このように、Make-A-Videoは、テキストと画像のペアから世界の様子とその説明を学習し、教師なしビデオ映像から世界の動きを学習する。Make-A-Videoには、
(1)T2Vモデルの学習を高速化できる(視覚表現とマルチモーダル表現を一から学習する必要がない)
(2)教師なしビデオ映像から世界の動きを学習できテキストとビデオのペアデータを必要としない、
(3)生成されたビデオは今日の画像生成モデルの持つ広大さ(美的感覚の多様性、幻想的な描写など)を継承している
という三つの利点があります。
我々は、T2Iモデルに新規かつ効果的な空間-時間モジュールを構築するための、シンプルかつ効果的な方法を設計する。まず、完全な時間的U-Netと注意テンソルを分解し、空間と時間で近似する。次に、T2V以外の様々なアプリケーションを可能にするビデオデコーダ、補間モデル、2つの超解像モデルにより、高解像度かつフレームレートのビデオを生成する空間時間パイプラインを設計する。空間的・時間的解像度、テキストへの忠実性、品質、すべての側面において、Make-A-Videoは質的にも量的にも、テキストからビデオへの生成における新しい最先端を打ち立てたと言える。

論文より

これまた凄いのが出てきましたね。「Make-A-Video」は現在論文のみ公開済みです。
今後の動向が気になる方は、是非サイトをチェックしてみてください。

リンク

Screenshot of makeavideo.studio


プロモーション


関連記事

  1. 4D Humans: Reconstructing and Tracking Humans with Transformers - 単眼カメラ映像から人物の動きをトラッキング出来るICCV 2023発表新技術!コードも公開され使用可能!

    2023-08-11

  2. Drag Your GAN: Interactive Point-based Manipulation on the Generative Image Manifold - 点を動かしてポージングや形状変形&画像調整を行えるAI技術!SIGGRAPH 2023 論文

    2023-05-19

  3. MusicLM - Googleがテキストから音楽を生成するAIモデルを発表!

    2023-01-31

  4. SMPLer-X: Scaling Up Expressive Human Pose and Shape Estimation - 従来より高品質な結果を実現!単眼カメラ映像からの人物の姿勢を検出する技術!NeurIPS 2023!

    2023-10-19

コメントをお待ちしています。

コメント

日本語が含まれない投稿は無視されます。-Posts that do not include the Japanese will be ignored-(スパム対策-anti Spam-)

3D人-3dnchu-

3D/2D/VR/GAME/AIなどのCGに関連する気になる情報やツールをほぼ毎日紹介!XやYoutubeなども是非フォローよろしくお願いします!

アーカイブ

カテゴリ

おすすめ商品Pickup

注目の記事

PR


PR


採用 | 3DCGアーティスト&テクニカルアーティスト大募集 | 株式会社Cygames

キャラクターライティングとVFX講座

   
USD
3D人のLINEアカウントを作りました!
友だち追加


follow us in feedly

RSSリーダーで購読する


ほしい物リスト公開中!
3D人運営に援助!
Amazonでリストを見る

Discordチャンネル公開

pixivFUNBOXページ公開!




おすすめ商品Pickup

おすすめ記事

ページ上部へ戻る