エントリーフォーム - COYOTE 3DCG STUDIO | C&R Creative Studios

Melt Mouse - デザイン情報発信メディア『Paraph -パラフ-』に...

マジシャン・デザイナー・アートディレクターの鎌田 亮平氏が立ち上げたデザイナーオススメアイテムの紹介などでお馴染みのメディア「Paraph -パラフ-」による革新的マウス「Melt Mouse」がKickstarterにて予約受付開始しました!

続きを読む

【製造業様向け】エピックゲームズジャパン合同ウェビナー2025 - ディプロス株...

2025年10月6日に開催された『【製造業様向け】エピックゲームズジャパン合同ウェビナー2025』のアーカイブ映像が公開されました!

続きを読む

FlexToon OSL Toon Manager v2.0 - MayaのAr...

Christophe Saillard氏によるMayaのArnold用トゥーンシェーダーパッケージ「FlexToon」のv2.0がリリースされていました。

続きを読む

【PR】Wingfox Black Friday Early Acess - C...

CG&デジタルアート関連チュートリアルサービス「Wingfox」にてブラックフライデー早期アクセス関連セールが実施中で新コースの各種が20%OFFで入手できるようです❗️!

続きを読む

アーティストのための動物解剖学:ドローイング&リファレンス - 動物の構造を理解...

アーティスト向けに動物の構造を解説した洋書「Animal Anatomy for Artists: A visual guide to the animal form」の日本語版『アーティストのための動物解剖学:ドローイング&リファレンス』がボーンデジタルから2025年11月下旬に発売されます!

続きを読む

Autodesk Flow Studio ソフトウェア | Autodesk Flow Studio 2025 の価格と購入 | Autodesk

MDM: Human Motion Diffusion Model - テキストから人物モーションの生成や合成が可能な技術が登場!

この記事は約2分9秒で読めます

テキストから人物モーションの生成や合成が可能な技術「MDM: Human Motion Diffusion Model」が登場!

2022/10/07 – Githubにてコードが公開されたのでリンクを追加

MDM: Human Motion Diffusion Model

自然で表現力豊かな人間の動きを生成することは、コンピュータ・アニメーションの聖域である。しかし、動きには多様性があり、それに対する人間の知覚的な感度や、正確な描写の難しさから、難しい課題となっています。そのため、現在の生成ソリューションは、低品質であるか、表現力に限界がある。他の領域で既に顕著な生成能力を示している拡散モデルは、その多対多の性質から人間の運動に対する有望な候補であるが、リソースを消費し、制御が困難な傾向がある。本論文では、分類器を用いない拡散ベースの生成モデルを人体運動領域用に慎重に適応させたMotion Diffusion Model (MDM)を紹介する。MDMはモーション生成の文献からの洞察を組み合わせた変換器ベースである。注目すべきデザインチョイスは、各拡散ステップにおいて、ノイズではなく、サンプルを予測することである。これにより、足の接触損失など、運動の位置と速度に関する確立された幾何学的損失の利用が容易になる。我々が示すように、MDMは汎用的なアプローチであり、異なる条件付けのモードや、異なる生成タスクが可能である。我々は、我々のモデルが軽量なリソースで学習可能でありながら、テキストからモーション、アクションからモーションの主要なベンチマークにおいて最先端の結果を達成することを示す。

MDMフレームワークは、様々な条件付けを可能にする汎用的な設計になっている。本発表では、テキストからモーション、アクションからモーション、そして無条件生成の3つのタスクを紹介する。MDMは、多様性と忠実性をトレードオフにする分類器不要の方法で学習し、同じモデルから条件付きと無条件の両方をサンプリングすることが可能である。テキストからモーションへの変換では、HumanML3DおよびKITベンチマークにおいて最先端の結果を達成し、一貫性のあるモーションを生成することができた。また、ユーザ調査の結果、人間の評価者は42%の確率で、生成したモーションを実モーションよりも好むことがわかった。また、Action-to-Motionでは、HumanAct12とUESTCのベンチマークにおいて、MDMはこのタスクのために特別に設計されたにもかかわらず、最先端技術を上回る性能を示した。

論文のみ公開、ソースコードはComming Soonとなっております。2022年10月7日にGithubにてソースコードも公開されました。この技術がどう発展していくのか、とても楽しみです。今後レイアウトなどもテキストで指定出来るようになれば、テキストだけで3Dドラマみたいなものが作れるようになりそうですね。

リンク

Screenshot of guytevet.github.io


プロモーション


関連記事

  1. Meshy-3 - 登場から1周年の3D系生成AIサービス!生成品質向上!彫刻やPBRスタイル対応!部分修正も可能になった最新アップデートが公開!

    2024-05-01

  2. SMPLer-X: Scaling Up Expressive Human Pose and Shape Estimation - 従来より高品質な結果を実現!単眼カメラ映像からの人物の姿勢を検出する技術!NeurIPS 2023!

    2023-10-19

  3. DuetGen - 音楽駆動による二人のペアダンスモーション生成システム!音楽とシナジーするインタラクティブなダンスを自動生成!

    2025-07-26

  4. GaussianObject: Just Taking Four Images to Get A High-Quality 3D Object with Gaussian Splatting - 4枚の画像からGaussian Splatting技術を活用し高品質な3Dオブジェクトを生成するための技術が登場!

    2024-05-21

コメントをお待ちしています。

コメント

日本語が含まれない投稿は無視されます。-Posts that do not include the Japanese will be ignored-(スパム対策-anti Spam-)

3D人-3dnchu-

3D/2D/VR/GAME/AIなどのCGに関連する個人的に気になる情報をほぼ毎日紹介!XやYoutubeなども是非フォローよろしくお願いします!

※当サイトの一部記事にはアフィリエイトが含まれております。

アーカイブ

カテゴリ

おすすめ商品Pickup

注目の記事

PR


PR






   
USD
3D人のLINEアカウントを作りました!
友だち追加


follow us in feedly

RSSリーダーで購読する


ほしい物リスト公開中!
3D人運営に援助!
Amazonでリストを見る

Discordチャンネル公開

pixivFUNBOXページ公開!




おすすめ商品Pickup

おすすめ記事

ページ上部へ戻る