エントリーフォーム - COYOTE 3DCG STUDIO | C&R Creative Studios

Dipal D1 - アニメキャラとリアルタイムで会話できる日本語対応の3D立体...

日本語にも対応3D立体AIキャラクターポッド「Dipal D1」のKickstarterが始動!そして海外クラウドファンディング商品ネット通販サイト「インディゴーゴージェーピー」でも取り扱いが開始されました。

続きを読む

n-Links Retarget - アイ・ペアーズ株式会社が国産の高精度モーシ...

2024年7月、国産スタートアップi-Pairsが、AIを活用した高精度なモーションリターゲットツール「n-Links Retarget(エヌリンクス・リターゲット)」を発表しました。

続きを読む

Blender MetaHuman Groom Starter + Hair C...

IamSH1VA氏がUnreal Engine 5.6のMetaHuman向けヘアーアセットをBlenderを使用し制作するスターターキット「Blender MetaHuman Groom Starter + Hair Cards」を公開しました!主にチュートリアル動画とアセット一式です。

続きを読む

Animationのラベルすっきりツール! - Animationウィンドウ内の...

ここあ氏( @kka_vrc )がAnimationウィンドウ内のラベル表記の不要箇所を非表示にしてスッキリさせる無料のUnityエディタ拡張「Animationのラベルすっきりツール! 」をBOOTH上で無料公開しています!

続きを読む

AnimaX: Animating the Inanimate in 3D wi...

動画拡散モデルの運動知識と骨格ベースアニメーションの制御性を融合するフレームワーク「AnimaX: Animating the Inanimate in 3D with Joint Video-Pose Diffusion Models」のプロジェクトページが公開されています。

続きを読む

従量課金制の Flex で柔軟に制作 | メディア&エンターテイメント | Autodesk

CommonSim-1 - AIの力で画像やアクション、テキストなどから適切な3Dコンテンツを生成するニューラル・シミュレーション・エンジンが登場!

この記事は約3分25秒で読めます

CSM(Common Sense Machines)にゆよる、画像、行動、テキストで制御するニューラル・シミュレーション・エンジン「CommonSim-1」が登場!


プロモーション

CGWORLD vol.323(2025年7月号)6月10日(火)発売! 『KEMURI』


CommonSim-1

Generative AIでは、多様な人間の経験や文化を大規模なモデルに圧縮する必要があります。実際、最近の大規模な生成モデル(Dall-E 2、StableDiffusion、Imagen、Make-A-Sceneなど)は、全く新しいイメージをゼロから作り出すという目覚ましい成果を上げている。このような流れの中で、AIシステムは、3Dモデル、長周期映像、効率的なアクションを生成することを学習する新しいクラスのシミュレータを作成することが自然な進化であると言えます。これらの技術は、ニューラルレンダリング、拡散モデル、および注意アーキテクチャの最近の進歩により、実現可能になりつつある。

Common Sense Machinesは、CommonSim-1と呼ばれるニューラル・シミュレーション・エンジンを構築しました。ユーザーやロボットは、コンテンツを作成したり、複雑なツールを操作するのに何週間も費やす代わりに、画像、アクション、テキストを通じてCommonSim-1と対話します。これらのインターフェースにより、写真を撮ったり、テキストで情景を描写したりするだけで、現実世界のデジタルレプリカを作成したり、新しい世界を想像したりすることができます。本日、これらのモデル機能をプレビューしています。開発者、クリエイター、研究者、その他の方々がどのような作品を作ることができるのか、今からとても楽しみです。

  • CommonSim-1: 経験から成長し適応するシミュレーター:新しいシミュレーション エンジンには、新しいインターフェイスが必要です。専用ツールの代わりに、、画像、言語、アクションで操作します。誰でもモデルにアクセスできるモバイルとウェブのインターフェース、ツールプラグインやREST API
  • 動画生成:わずか1フレームと一連の動作(カメラや体の動き)から高解像度の動画(512×512)を生成
    適切なデータがあれば、同じアーキテクチャをトレーニングして、多くの実施形態 (カメラ、ロボット、自動車など) にわたるタスクを解決できます。
  • 3Dコンテンツ生成:オブジェクトの動画をアップロードしクラウド上で処理。
    ユニバーサル3Dファイルフォーマット(obj, usdz, blend, glTFなど)やNeural Radiance Fields(NeRF)に簡単にエクスポート
  • これらの3Dアセットを既存の3Dエンジンにインポートして、シーンの合成やレンダリングが可能。ハイブリッド・レンダラー(現在Blenderに対応、今後対応予定)により、NeRFを従来の3Dアセットと合成

ニューラル言語は、像上の状況を記述するための強力な手段である。例えば、椅子の3Dモデルを持っていて、それを全く新しい環境でレンダリングしようとした場合、満足のいく結果を得るには、通常、数日から数週間かかるでしょう。テキスト・トゥ・イメージ・モデルは、このプロセスを自動化することができます。CommonSim-1で生成したメッシュやNeRFを使い、テキストプロンプトに自然言語で説明を入力すれば、新しいハイブリッドシーンを無制限に生成することができるのです。

これらのコンテンツ生成機構は、自動ラベル付けされた合成データを作成し、知覚システムを訓練するのに十分な精度と柔軟性を備えています。

ここでは、検出、セグメンテーション、6自由度ポーズトラッキングのためのエンドツーエンドのビジョンシステムの例を紹介します。このシステムは、人間が注釈を付けたデータや人間が作成したモデルを一切使わずにトレーニングされました。私たちはこれらのシステムを、食料品店、倉庫、工場、研究所、医療現場などの対象物でテストしました。

こういった3DCG制作の根本が変わってきそうだ…。
現在はアプリケーション、API、チェックポイント、コードへの早期アクセスのサインアップが可能とのこと。気になる方は是非チェックしてみてください。

リンク

Screenshot of csm.ai

プロモーション


関連記事

  1. Editable Dance GEneration (EDGE) - 音楽に合わせて人型3Dモデル用のダンスアニメーションを生成可能なAIモデル!スタンフォード大学が開発!

    2023-04-29

  2. Talking Head Anime from a Single Image 3 - 1枚の2Dキャラ立ち絵からVTuberになれるAI技術の新バージョン!上半身の動きにも対応!

    2022-06-06

  3. Space-Time Neural Irradiance Fields for Free-Viewpoint Video - 単一視点の動画から破綻を抑えて3D空間を取り込むための技術

    2020-11-26

  4. Runway Gen-3 Alpha - テキストから高品質な動画を生成出来るモデルの新バージョン「Gen-3 Alpha」をサブスクユーザー向けに公開!

    2024-07-02

コメントをお待ちしています。

コメント

日本語が含まれない投稿は無視されます。-Posts that do not include the Japanese will be ignored-(スパム対策-anti Spam-)

3D人-3dnchu-

3D/2D/VR/GAME/AIなどのCGに関連する個人的に気になる情報をほぼ毎日紹介!XやYoutubeなども是非フォローよろしくお願いします!

※当サイトの一部記事にはアフィリエイトが含まれております。

アーカイブ

カテゴリ

おすすめ商品Pickup

注目の記事

PR


PR

3DCG募集要項 | 株式会社Colorful Palette

採用 | 3DCGアーティスト&テクニカルアーティスト大募集 | 株式会社Cygames

   
USD
3D人のLINEアカウントを作りました!
友だち追加


follow us in feedly

RSSリーダーで購読する


ほしい物リスト公開中!
3D人運営に援助!
Amazonでリストを見る

Discordチャンネル公開

pixivFUNBOXページ公開!




おすすめ商品Pickup

おすすめ記事

ページ上部へ戻る