エントリーフォーム - COYOTE 3DCG STUDIO | C&R Creative Studios

アーティストのための動物解剖学:ドローイング&リファレンス - 動物の構造を理解...

アーティスト向けに動物の構造を解説した洋書「Animal Anatomy for Artists: A visual guide to the animal form」の日本語版『アーティストのための動物解剖学:ドローイング&リファレンス』がボーンデジタルから2025年11月下旬に発売されます!

続きを読む

Gizmify Media Plane - 連番画像は不要!MP4・AVI・MK...

Gizmify StudiosによるMP4・AVI・MKV・MOVなどの動画ファイルを直接プレーンに読み込む事が可能となるMayaプラグイン「Gizmify Media Plane」のご紹介!

続きを読む

3DMakerpro Eagle Review - 空間を手軽にデジタル化!14...

140mの広域を空間キャプチャー可能なLiDAR 3Dスキャナー3DMakerpro「Eagle」&「Eagle Max」が日本に上陸!Makuakeにてクラウドファンディングが実施中です!一足先にレビューさせていただきました!

続きを読む

CameraBag 2026.0 - 多機能高性能かつ買い切りのスタンドアロン写...

Nevercenterによる写真や動画編集の為のスタンドアロンソフト「CameraBag 2026.0」がリリースされました!

続きを読む

Quad Filler v0.1 Beta Early Access - 3エッ...

数多くの便利アドオンを開発&販売しているCasey_Sheep氏による3エッジと1エッジをワンクリックで理想的な四角形で埋めてくれるシンプルなBlenderアドオン「Quad Filler v0.1」のベータ版が早期アクセスリリースされました!

続きを読む

Autodesk Flow Studio ソフトウェア | Autodesk Flow Studio 2025 の価格と購入 | Autodesk

Feat2GS: Probing Visual Foundation Models with Gaussian Splatting - カジュアルな画像からAIがどこまで3D形状とテクスチャを理解できるかをGaussian Splattingで検証する評価手法!

この記事は約2分16秒で読めます

Yue Chen氏、Xingyu Chen氏、Anpei Chen氏、Gerard Pons-Moll氏、Yuliang Xiu氏らによる、CVPR 2025技術論文「Feat2GS: Probing Visual Foundation Models with Gaussian Splatting」の紹介。

[CVPR 2025] Feat2GS: Probing Visual Foundation Models with Gaussian Splatting

我々は、視覚的基礎モデルの「テクスチャとジオメトリの認識」を調査するための統一されたフレームワークであるFeat2GSを発表する。 新しいビュー合成は、3D評価の効果的な代理として機能します。

仕組み
何気なく撮影された写真は、特徴を抽出するために視覚的基礎モデル(VFM)に入力され、相対的なポーズを得るためにステレオ再構成器に入力される。 ピクセル単位の特徴は、測光損失で訓練された軽量読み出しレイヤーを使用して、3Dガウシアン(3DGS)に変換されます。 3DGSパラメータはジオメトリとテクスチャにグループ化され、VFMにおけるジオメトリ/テクスチャの認識を個別に分析することができる。 我々は、いくつかのVFMの3D認識を調査するために広範な実験を実施し、3D認識VFMにつながる成分を調査する。 これらの知見を基に、多様なデータセットにおいてSOTAを達成するいくつかのバリエーションを開発する。 これにより、Feat2GSはVFMのプロービングや、NVSのためのシンプルで効果的なベースラインとして有用である。

「AIは3Dの形や質感を本当に理解してるのか?」をチェックする為の技術とのことで、どういう立ち位置なのかわからないのでAIに今後の可能性を聞いてみました。

今後の応用分野として、以下のような展開が期待されます:

① 3D生成AIの“実力チェックツール”に

→ いま流行りの「テキストから3D生成」や「1枚の画像から3D構築」などに使われるAIの性能を、客観的に比べる指標として使える。

② 軽量な3D再構築パイプラインに

→ 本来3D再構築にはLiDARや正確なカメラ情報が必要だったけど、Feat2GSのような仕組みを使えば簡単な画像群からの3D生成がもっと手軽に

③ AIトレーニングのガイドに

→ どのモデルが「形をちゃんと理解してるか」「テクスチャを重視してるか」を見極めて、より優れた視覚AIを作る設計に役立つ

ほぉ…結構重要な技術ですね。
Githubではコードも公開済みで、Hugging faceのでもページも用意されています。詳細はプロジェクトページをご確認ください!

リンク

Screenshot of fanegg.github.io

プロモーション


関連記事

  1. ASH: Animatable Gaussian Splats for Efficient and Photoreal Human Rendering - リアルタイムで動的な人物のためのアニメーション対応Gaussian Splattingアプローチ!

    2024-04-28

  2. Binary Opacity Grids: Capturing Fine Geometric Detail for Mesh-Based View Synthesis - NeRFや3DGSに続く次世代シーン構築技術!メッシュベースでより細かなディテールを再現可能に!

    2024-02-26

  3. Vidu4D: Single Generated Video to High-Fidelity 4D Reconstruction with Dynamic Gaussian Surfels - 単一生成動画から4D(連続3D)表現を構築する新しい再構成技術!

    2024-05-28

  4. EDGS: Eliminating Densification for Efficient Convergence of 3DGS - 既存の3DGSよりもより精密かつ早く構築出来る異なるアプローチ!

    2025-04-23

コメントをお待ちしています。

コメント

日本語が含まれない投稿は無視されます。-Posts that do not include the Japanese will be ignored-(スパム対策-anti Spam-)

3D人-3dnchu-

3D/2D/VR/GAME/AIなどのCGに関連する個人的に気になる情報をほぼ毎日紹介!XやYoutubeなども是非フォローよろしくお願いします!

※当サイトの一部記事にはアフィリエイトが含まれております。

アーカイブ

カテゴリ

おすすめ商品Pickup

注目の記事

PR


PR






   
USD
3D人のLINEアカウントを作りました!
友だち追加


follow us in feedly

RSSリーダーで購読する


ほしい物リスト公開中!
3D人運営に援助!
Amazonでリストを見る

Discordチャンネル公開

pixivFUNBOXページ公開!




おすすめ商品Pickup

おすすめ記事

ページ上部へ戻る