エントリーフォーム - COYOTE 3DCG STUDIO | C&R Creative Studios

Procedural Backrooms Generator | Blender...

Šime Bugarija氏がBlenderのGeometry Nodesなどを活用したプロシージャル「The Backrooms (ザ・バックルームズ)」ジェネレーターをリリースしました!

続きを読む

SPZ 4 | 3D Gaussian Splattingを軽量・高速・巨大シー...

Niantic Spatialによる 3D Gaussian Splatting向け圧縮技術「SPZ」のバージョン4が公開されております!

続きを読む

UE5 Kurie VFX Shader v1.0 | Unreal Engin...

ゲーム系のVFXアーティストKurie氏(@Kurie_vfx)がエフェクト制作で活用できるUnreal Engine 5向けの汎用マスターマテリアルパック「Kurie VFX Shader」を無料公開しました!

続きを読む

【PR】Wingfox Happy May Day | Wingfoxにて202...

Wingfoxでは2026年5月12日まで「59ドル以上のご購入で30%OFF」となる新キャンペーンを実施中です!

続きを読む

Project Falcon Tech Preview | Autodeskから...

2026年5月5日、Autodeskがブラウザ上で動作するキットバッシングモデリングツール「Project Falcon」の技術プレビュー版を公開しました!

続きを読む

Make-A-Video - MetaのAI研究開発チームによるテキストからビデオを生成する技術が発表!

この記事は約2分5秒で読めます

Meta AIによる、テキストプロンプトから動画を生成する技術「Make-A-Video」が発表されました。

Make-A-Video

Make-A-Videoの研究は、テキストからビデオへの生成を可能にするために構築されたテキストから画像への生成技術における最近の進歩をベースにしています。このシステムは、説明文付きの画像を用いて、世界がどのように見えるか、また、どのように説明されることが多いかを学習します。また、ラベルのない動画を使って、世界の動きを学習します。このデータをもとに、Make-A-Videoは、わずかな文字や行のテキストで、気まぐれで世界にひとつだけの動画を生成し、あなたの想像力を膨らませます。

公式ページより

私たちは、Text-to-Image(T2I)生成における最近の驚異的な進歩を、Text-to-Video(T2V)に直接変換するアプローチであるMake-A-Videoを提案します。我々の直感は単純で、テキストと画像のペアデータから、世界がどのように見えるか、どのように記述されるかを学び
このように、Make-A-Videoは、テキストと画像のペアから世界の様子とその説明を学習し、教師なしビデオ映像から世界の動きを学習する。Make-A-Videoには、
(1)T2Vモデルの学習を高速化できる(視覚表現とマルチモーダル表現を一から学習する必要がない)
(2)教師なしビデオ映像から世界の動きを学習できテキストとビデオのペアデータを必要としない、
(3)生成されたビデオは今日の画像生成モデルの持つ広大さ(美的感覚の多様性、幻想的な描写など)を継承している
という三つの利点があります。
我々は、T2Iモデルに新規かつ効果的な空間-時間モジュールを構築するための、シンプルかつ効果的な方法を設計する。まず、完全な時間的U-Netと注意テンソルを分解し、空間と時間で近似する。次に、T2V以外の様々なアプリケーションを可能にするビデオデコーダ、補間モデル、2つの超解像モデルにより、高解像度かつフレームレートのビデオを生成する空間時間パイプラインを設計する。空間的・時間的解像度、テキストへの忠実性、品質、すべての側面において、Make-A-Videoは質的にも量的にも、テキストからビデオへの生成における新しい最先端を打ち立てたと言える。

論文より

これまた凄いのが出てきましたね。「Make-A-Video」は現在論文のみ公開済みです。
今後の動向が気になる方は、是非サイトをチェックしてみてください。

リンク

Screenshot of makeavideo.studio

関連記事

  1. Neuralangelo: High-Fidelity Neural Surface Reconstruction - 2D映像を複雑なディテールを持つ3D構造物に変える新しいAIモデル!NVIDIA Researchによる技術!CVPR2023技術論文!

    2023-06-07

  2. GaussianObject: Just Taking Four Images to Get A High-Quality 3D Object with Gaussian Splatting - 4枚の画像からGaussian Splatting技術を活用し高品質な3Dオブジェクトを生成するための技術が登場!

    2024-05-21

  3. Chimera Painter - GoogleがGANを使用したクリーチャー生成のアプローチとペイントツールをWeb上で公開

    2020-11-19

  4. Space-Time Neural Irradiance Fields for Free-Viewpoint Video - 単一視点の動画から破綻を抑えて3D空間を取り込むための技術

    2020-11-26

コメントをお待ちしています。

コメント

日本語が含まれない投稿は無視されます。-Posts that do not include the Japanese will be ignored-(スパム対策-anti Spam-)

3D人-3dnchu-

3D/2D/VR/GAME/AIなどのCGに関連する個人的に気になる情報をほぼ毎日紹介!XやYoutubeなども是非フォローよろしくお願いします!
※当サイトのリンクにはアフィリエイトを含みます

※当サイトの一部記事にはアフィリエイトが含まれております。

スポンサープロダクト


X-Ray Realtime Light and TexturingTool

CGElementaryに関する記事一覧


Character Creator - アニメーション、ゲーム、AR/VR のための 3D キャラメイクソフト

Reallusionに関する記事一覧


Paintstorm Studio

Paintstorm Studioに関する記事一覧


MarvelousDesigner

MarvelousDesignerに関する記事一覧


JangaFX - Real-Time VFX Software For Real-Time VFX Artists

JangaFXに関する記事一覧


パルミーの講座が見放題!月謝制お申し込み|お絵かき講座パルミー

Palmieに関する記事一覧


AAA Character Creation: The Boxing Bunny

WINGFOXに関する記事一覧


Meshy - Free AI 3D Model Generator

Meshyに関する記事一覧


アーカイブ

カテゴリ

おすすめ商品Pickup

注目の記事

PR


PR






   
USD
3D人のLINEアカウントを作りました!
友だち追加


follow us in feedly

RSSリーダーで購読する


ほしい物リスト公開中!
3D人運営に援助!
Amazonでリストを見る

Discordチャンネル公開

pixivFUNBOXページ公開!




おすすめ商品Pickup

おすすめ記事

ページ上部へ戻る