株式会社ゲームフリーク 中途採用オンライン企業説明会・パネルディスカッション(12/10)|ゲーム業界の求人・転職・中途採用情報なら【ファミキャリ】

Blender 5.0 - モディファイア改善!GeoNode大幅進化!ACES...

2025年11月18日(現地時間) 無料&オープンソースのCGソフトウェアの最新メジャーアップデート「Blender 5.0」が正式リリースされました!

続きを読む

World Labs Marble - テキスト、画像、動画から3D世界(3D ...

2025年11月12日(現地時間)、AI企業World Labsが、テキスト、画像、動画から3D世界を生成する世界生成モデル「 Marble」を一般公開しました!

続きを読む

Unreal Engine 5.7 リリース!オープンワールドに適した新機能多数...

2025年11月12日ついに「Unreal Engine 5.7」が正式リリースされました!オープンワールド開発に適した多数の新機能を搭載しています!

続きを読む

Unreal Drive - 複雑な道路ネットワークを構築可能なUnreal E...

udriveによるUnreal Engine 5向け道路ネットワーク構築プラグイン「Unreal Drive」がFab上でリリースされています。個人向けはなんと無料ですよ!

続きを読む

GASP_ADDONS - 無料のサンプル「Game Animation Sam...

PRAKASHRAJ M氏が、UE5公式のサンプルプロジェクト「Game Animation Sample Project(GASP)」に、バイクや車両に乗る、泳ぐ、フラッシュライト点灯、ドッジ、筋斗雲に乗るなどを追加した「GASP_ADDONS」がFab上で無料公開されています!

続きを読む

Autodesk Flow Studio ソフトウェア | Autodesk Flow Studio 2025 の価格と購入 | Autodesk

MDM: Human Motion Diffusion Model - テキストから人物モーションの生成や合成が可能な技術が登場!

この記事は約2分9秒で読めます

テキストから人物モーションの生成や合成が可能な技術「MDM: Human Motion Diffusion Model」が登場!

2022/10/07 – Githubにてコードが公開されたのでリンクを追加

MDM: Human Motion Diffusion Model

自然で表現力豊かな人間の動きを生成することは、コンピュータ・アニメーションの聖域である。しかし、動きには多様性があり、それに対する人間の知覚的な感度や、正確な描写の難しさから、難しい課題となっています。そのため、現在の生成ソリューションは、低品質であるか、表現力に限界がある。他の領域で既に顕著な生成能力を示している拡散モデルは、その多対多の性質から人間の運動に対する有望な候補であるが、リソースを消費し、制御が困難な傾向がある。本論文では、分類器を用いない拡散ベースの生成モデルを人体運動領域用に慎重に適応させたMotion Diffusion Model (MDM)を紹介する。MDMはモーション生成の文献からの洞察を組み合わせた変換器ベースである。注目すべきデザインチョイスは、各拡散ステップにおいて、ノイズではなく、サンプルを予測することである。これにより、足の接触損失など、運動の位置と速度に関する確立された幾何学的損失の利用が容易になる。我々が示すように、MDMは汎用的なアプローチであり、異なる条件付けのモードや、異なる生成タスクが可能である。我々は、我々のモデルが軽量なリソースで学習可能でありながら、テキストからモーション、アクションからモーションの主要なベンチマークにおいて最先端の結果を達成することを示す。

MDMフレームワークは、様々な条件付けを可能にする汎用的な設計になっている。本発表では、テキストからモーション、アクションからモーション、そして無条件生成の3つのタスクを紹介する。MDMは、多様性と忠実性をトレードオフにする分類器不要の方法で学習し、同じモデルから条件付きと無条件の両方をサンプリングすることが可能である。テキストからモーションへの変換では、HumanML3DおよびKITベンチマークにおいて最先端の結果を達成し、一貫性のあるモーションを生成することができた。また、ユーザ調査の結果、人間の評価者は42%の確率で、生成したモーションを実モーションよりも好むことがわかった。また、Action-to-Motionでは、HumanAct12とUESTCのベンチマークにおいて、MDMはこのタスクのために特別に設計されたにもかかわらず、最先端技術を上回る性能を示した。

論文のみ公開、ソースコードはComming Soonとなっております。2022年10月7日にGithubにてソースコードも公開されました。この技術がどう発展していくのか、とても楽しみです。今後レイアウトなどもテキストで指定出来るようになれば、テキストだけで3Dドラマみたいなものが作れるようになりそうですね。

リンク

Screenshot of guytevet.github.io


プロモーション


関連記事

  1. Snappers Facial Rig - リアルタイムのシワ表現もお見事!Maya&3dsMax用フェイシャルリグシステムデモ映像!

    2014-05-27

  2. MeshPad: Interactive Sketch Conditioned Artistic-designed Mesh Generation and Editing - スケッチ入力をベースに忠実性の高い3Dメッシュを生成する技術!

    2025-03-12

  3. MusicLM - Googleがテキストから音楽を生成するAIモデルを発表!

    2023-01-31

  4. GaussianObject: Just Taking Four Images to Get A High-Quality 3D Object with Gaussian Splatting - 4枚の画像からGaussian Splatting技術を活用し高品質な3Dオブジェクトを生成するための技術が登場!

    2024-05-21

コメントをお待ちしています。

コメント

日本語が含まれない投稿は無視されます。-Posts that do not include the Japanese will be ignored-(スパム対策-anti Spam-)

3D人-3dnchu-

3D/2D/VR/GAME/AIなどのCGに関連する個人的に気になる情報をほぼ毎日紹介!XやYoutubeなども是非フォローよろしくお願いします!

※当サイトの一部記事にはアフィリエイトが含まれております。

アーカイブ

カテゴリ

おすすめ商品Pickup

注目の記事

PR


PR






   
USD
3D人のLINEアカウントを作りました!
友だち追加


follow us in feedly

RSSリーダーで購読する


ほしい物リスト公開中!
3D人運営に援助!
Amazonでリストを見る

Discordチャンネル公開

pixivFUNBOXページ公開!




おすすめ商品Pickup

おすすめ記事

ページ上部へ戻る