エントリーフォーム - COYOTE 3DCG STUDIO | C&R Creative Studios

【PR】Unreal Engine CG Concept Art: [Four ...

3Dレベルアーティストの太陽蛋(Solar Egg)氏によるUnreal EngineやBlender使用したコンセプトアートシーン制作解説コース「Unreal Engine CG Concept Art: [Four Major Scenes | Mastering Light and Shadow]」がCG&デジタルアート関連チュートリアルサービス-Wingfoxにて取り扱い開始!

続きを読む

SwitchLight 3.0 - 「Beeble」のAIソリューションで使用可...

Beebleは動画からPBR素材を生成するモデル「SwitchLight」のv3.0をリリースしました!クラウド版「Beeble」と新たなデスクトップアプリ「Beeble Studio」の何方でも利用可能です!

続きを読む

完全攻略53講:VTuberデビュー向け!Blenderで制作する3Dバーチャル...

Colosoで現在公開中のVTuberアバター制作解説フルチュートリアル講座『完全攻略53講:VTuberデビュー向け!Blenderで制作する3Dバーチャルアバター』を受講いたしましたのでその感想を語りたいと思います!

続きを読む

Tokyo Anim Unite 2025 - 豪華ゲストによる講演や交流が可能...

映像やゲームなどのエンタメ制作に携わるすべての人に向けた大イベントの第2回「Tokyo Anim Unite 2025」が2025年11月8~9日の2日間 ベルサール新宿グランドコンファレンスセンターにて開催されます!

続きを読む

Affinity - 『Designer』『Photo』『Publisher』3...

『Affinity』シリーズを手掛けるSerifを2024年にCanvaが買収しましたが、この度遂にCanvaは『Affinity Designer』『Affinity Photo』『Affinity Publisher』をひとつに統合した新ツール『Affinity』を完全無料化でリリースしました。ということで業界が色々と盛り上がっていますね。

続きを読む

Autodesk Flow Studio ソフトウェア | Autodesk Flow Studio 2025 の価格と購入 | Autodesk

Geo4D: Leveraging Video Generators for Geometric 4D Scene Reconstruction - 動画生成AIを活用し映像からシーン形状を再構築する技術!

この記事は約1分39秒で読めます

オックスフォード大学 視覚幾何学グループのZeren Jiang氏らによる、動画生成AIを活用し映像からシーン形状を再構築する技術アプローチ「Geo4D: Leveraging Video Generators for Geometric 4D Scene Reconstruction」が公開されています!

Geo4D: Leveraging Video Generators for Geometric 4D Scene Reconstruction

動的シーンの単眼3D再構成のためにビデオ拡散モデルを再利用する手法であるGeo4Dを紹介する。 Geo4Dは、このようなビデオモデルによって捕捉される強力な動的事前分布を利用することで、ゼロショットで実データにうまく汎化しながら、合成データのみを用いて学習することができる。 Geo4Dは、複数の補完的な幾何学的モダリティ、すなわち点、深度、光線マップを予測する。 新しいマルチモーダルアライメントアルゴリズムを用いて、推論時にこれらのモダリティや複数のスライディングウィンドウを整列・融合させることで、長尺映像のロバストで正確な4D再構成を実現する。 複数のベンチマークにわたる広範な実験により、Geo4Dは、動的なシーンを扱うように設計されたMonST3Rのような最近の手法も含め、最先端のビデオ奥行き推定手法を大幅に上回ることが示されている。

  • Geo4D:動画生成モデルを活用した動的シーンの再構築フレームワークを提案
    市販の動画生成AI(例:ビデオディフュージョンモデル)を活用して、動きのあるシーンの形状を再構成する革新的な手法
  • 一貫した形状を学習させるための「マルチモーダル幾何表現」を導入
    ポイントマップ、深度マップ、レイマップなど、複数の形状データを組み合わせて、訓練中の安定したジオメトリ学習を実現
  • テスト時には軽量なマルチモーダル整合処理で形状を統合
    類似情報を含む複数の幾何表現を融合し、ブレのない4D再構築を実現
  • 動画からの深度推定で最先端(SOTA)性能を達成
    加えて、カメラの動き(ポーズ推定)についても従来手法と同等の精度を示す

こういう技術がどんどん進んでいくと、実写映像から動きも含めたリアルな3Dシーンを自動生成する未来が出てくるんですかね。深度情報もかなり安定した結果が得られているみたいですね。今後の展開が楽しみです。プロジェクトページやコードも公開されておりますので、気になる方は是非チェックしてみてください!

リンク

Screenshot of geo4d.github.io
Screenshot of github.com


プロモーション


関連記事

  1. Make-A-Video - MetaのAI研究開発チームによるテキストからビデオを生成する技術が発表!

    2022-09-30

  2. MeshPad: Interactive Sketch Conditioned Artistic-designed Mesh Generation and Editing - スケッチ入力をベースに忠実性の高い3Dメッシュを生成する技術!

    2025-03-12

  3. MV-Adapter: Multi-view Consistent Image Generation Made Easy - テキストや画像から高精度なマルチアングル画像を生成する技術!テクスチャとして適用可能なデモも公開!

    2025-03-31

  4. AI Learns to Park - UnityのML-Agentsを使用し自動車の駐車を学習している様子。

    2020-02-05

コメントをお待ちしています。

コメント

日本語が含まれない投稿は無視されます。-Posts that do not include the Japanese will be ignored-(スパム対策-anti Spam-)

3D人-3dnchu-

3D/2D/VR/GAME/AIなどのCGに関連する個人的に気になる情報をほぼ毎日紹介!XやYoutubeなども是非フォローよろしくお願いします!

※当サイトの一部記事にはアフィリエイトが含まれております。

アーカイブ

カテゴリ

おすすめ商品Pickup

注目の記事

PR


PR






   
USD
3D人のLINEアカウントを作りました!
友だち追加


follow us in feedly

RSSリーダーで購読する


ほしい物リスト公開中!
3D人運営に援助!
Amazonでリストを見る

Discordチャンネル公開

pixivFUNBOXページ公開!




おすすめ商品Pickup

おすすめ記事

ページ上部へ戻る