株式会社ゲームフリーク 中途採用オンライン企業説明会・パネルディスカッション(12/10)|ゲーム業界の求人・転職・中途採用情報なら【ファミキャリ】

ShapeScape Studio - Painterly Tree &...

Cody Gindy&Tradigital3D(Alan Wyatt氏)による手描き感溢れる植物などを手軽に制作可能なBlender用NPRツールキット「ShapeScape Studio - Painterly Tree & Flora Creator」がリリースされました!

続きを読む

CamKeys v3.0 - 疑似パース風変形を施したりカメラとの相対角度に基づ...

Beyond Dev(Tyler Walker氏)がカメラとの相対角度に基づきシェイプキーを制御するBlenderアドオン「CamKeys v3.0」がリリースされています!

続きを読む

Circular hard-surface kitbash set - モデラー...

背景モデラー兼ディレクター 星野 昇平氏が48個の円形ハードサーフェス・キットバッシュモデル「Circular hard-surface kitbash set」をGumroad上で無料配布しています!商用利用可とのこと!

続きを読む

LumiTex: Towards High-Fidelity PBR Textu...

香港中文大学(深圳)、香港科技大学・香港大学・北京大学、そして企業研究部門 LIGHTSPEED に所属する研究者らによる共同研究チームは、新しいPBRテクスチャ生成手法「LumiTex」を発表していました。ICLR 2026向け技術論文。

続きを読む

Mesh Repair - スキャンメッシュの修復に最適!メッシュの穴埋めを行う...

Mad Processor(Vlad Erium氏)によるメッシュの穴埋めを行うオープンソースのコマンドラインインターフェース&Blenderアドオン「Mesh Repair」がGithub上で公開されています!

続きを読む

Autodesk Flow Studio ソフトウェア | Autodesk Flow Studio 2025 の価格と購入 | Autodesk

Geo4D: Leveraging Video Generators for Geometric 4D Scene Reconstruction - 動画生成AIを活用し映像からシーン形状を再構築する技術!

この記事は約1分39秒で読めます

オックスフォード大学 視覚幾何学グループのZeren Jiang氏らによる、動画生成AIを活用し映像からシーン形状を再構築する技術アプローチ「Geo4D: Leveraging Video Generators for Geometric 4D Scene Reconstruction」が公開されています!

Geo4D: Leveraging Video Generators for Geometric 4D Scene Reconstruction

動的シーンの単眼3D再構成のためにビデオ拡散モデルを再利用する手法であるGeo4Dを紹介する。 Geo4Dは、このようなビデオモデルによって捕捉される強力な動的事前分布を利用することで、ゼロショットで実データにうまく汎化しながら、合成データのみを用いて学習することができる。 Geo4Dは、複数の補完的な幾何学的モダリティ、すなわち点、深度、光線マップを予測する。 新しいマルチモーダルアライメントアルゴリズムを用いて、推論時にこれらのモダリティや複数のスライディングウィンドウを整列・融合させることで、長尺映像のロバストで正確な4D再構成を実現する。 複数のベンチマークにわたる広範な実験により、Geo4Dは、動的なシーンを扱うように設計されたMonST3Rのような最近の手法も含め、最先端のビデオ奥行き推定手法を大幅に上回ることが示されている。

  • Geo4D:動画生成モデルを活用した動的シーンの再構築フレームワークを提案
    市販の動画生成AI(例:ビデオディフュージョンモデル)を活用して、動きのあるシーンの形状を再構成する革新的な手法
  • 一貫した形状を学習させるための「マルチモーダル幾何表現」を導入
    ポイントマップ、深度マップ、レイマップなど、複数の形状データを組み合わせて、訓練中の安定したジオメトリ学習を実現
  • テスト時には軽量なマルチモーダル整合処理で形状を統合
    類似情報を含む複数の幾何表現を融合し、ブレのない4D再構築を実現
  • 動画からの深度推定で最先端(SOTA)性能を達成
    加えて、カメラの動き(ポーズ推定)についても従来手法と同等の精度を示す

こういう技術がどんどん進んでいくと、実写映像から動きも含めたリアルな3Dシーンを自動生成する未来が出てくるんですかね。深度情報もかなり安定した結果が得られているみたいですね。今後の展開が楽しみです。プロジェクトページやコードも公開されておりますので、気になる方は是非チェックしてみてください!

リンク

Screenshot of geo4d.github.io
Screenshot of github.com


プロモーション


関連記事

  1. ChatGPT - 人生の悩みからプログラムのコードやツールのスクリプトも教えてくれる 高度な対話型チャットAIがお試し可能!

    2022-12-02

  2. TextureDreamer: Image-guided Texture Synthesis through Geometry-aware Diffusion - 数枚の画像からターゲットの3Dモデルにテクスチャを転送する技術!

    2024-01-22

  3. Pippo: High-Resolution Multi-View Humans from a Single Image - 1枚の人物写真から複数アングル動画を生成する技術!

    2025-02-21

  4. TRELLIS: Structured 3D Latents for Scalable and Versatile 3D Generation - マイクロソフトによるAI活用3Dアセット生成技術が登場!テキストや画像から3Dアセットを生成!

    2024-12-12

コメントをお待ちしています。

コメント

日本語が含まれない投稿は無視されます。-Posts that do not include the Japanese will be ignored-(スパム対策-anti Spam-)

3D人-3dnchu-

3D/2D/VR/GAME/AIなどのCGに関連する個人的に気になる情報をほぼ毎日紹介!XやYoutubeなども是非フォローよろしくお願いします!

※当サイトの一部記事にはアフィリエイトが含まれております。

アーカイブ

カテゴリ

おすすめ商品Pickup

注目の記事

PR


PR






   
USD
3D人のLINEアカウントを作りました!
友だち追加


follow us in feedly

RSSリーダーで購読する


ほしい物リスト公開中!
3D人運営に援助!
Amazonでリストを見る

Discordチャンネル公開

pixivFUNBOXページ公開!




おすすめ商品Pickup

おすすめ記事

ページ上部へ戻る