単一生成動画から忠実性の高いDGS(Dynamic Gaussian Surfels)を生成する再構成モデル「Vidu4D: Single Generated Video to High-Fidelity 4D Reconstruction with Dynamic Gaussian Surfels」のプロジェクトページが公開されています!
Vidu4D: Single Generated Video to High-Fidelity 4D Reconstruction with Dynamic Gaussian Surfels
映像生成モデルは、リアルで想像力豊かなフレームを生成する能力から、特に注目されている。また、これらのモデルは強い3次元一貫性を示すことが観察されており、世界シミュレータとして機能する可能性を大きく高めている。この研究では、非剛性とフレーム歪みに関連する課題に対処し、単一生成動画から4D(すなわち連続3D)表現を正確に再構成することに優れた、新しい再構成モデルであるVidu4Dを紹介する。この機能は、空間的・時間的な一貫性を維持した忠実度の高いバーチャルコンテンツを作成するために極めて重要です。Vidu4Dの中核となるのは、当社が提案するDGS(Dynamic Gaussian Surfels)技術です。DGSは、時間的に変化するワーピング関数を最適化し、ガウスサーフェル(表面要素)を静的な状態から動的にワーピングされた状態に変換します。この変換により、経時的な動きや変形を正確に描写することができます。サーフェスに整列したガウスサーフェルの構造的完全性を保持するために、法線を推定するための連続ワーピング場に基づくワーピング状態の幾何学的正則化を設計する。さらに、ガウスサーフェルの回転パラメータとスケーリングパラメータの精密化を学習することで、ワーピングプロセス中のテクスチャのちらつきを大幅に緩和し、きめ細かい外観の詳細のキャプチャを強化する。また、Vidu4Dは、DGSのワーピングフィールドの適切な開始を提供する新しい初期化状態を含んでいる。Vidu4Dに既存のビデオ生成モデルを装備することで、全体的なフレームワークは、アピアランスとジオメトリの両方において、忠実度の高いテキストから4Dへの生成を実証している。
Vidu4Dって何?
Vidu4Dは、1本の動画から立体的で動きもリアルな3D映像を作る技術です。今までも動画を3Dにする方法はありましたが、動きがなめらかじゃなかったり、歪みが出たりしていました。
Vidu4Dは、この問題を解決します。この技術を使うと、動画の中の動きが正確に再現できます。例えば、動物が走る姿や、人がジャンプする動きなども自然に見えるようになります。
どんなふうに動くの?
Vidu4Dは、動画から「ガウスサーフェル」という特別な仕組みを使います。サーフェルは、表面の小さな要素みたいなものです。これをガウスサーフェルという方法でうまくつなぎ合わせて、動画の中の動きを再現します。
このガウスサーフェルは、時間の経過によって動きや変形するので、動画の中のキャラクターや物体の動きをリアルに再現できます。ちょうど、粘土細工を動かすような感じです。
より良い見た目を実現
さらに、この技術では、サーフェルの質感や回転も考慮するので、細かい見た目の変化も滑らかに表現できます。例えば、テクスチャがちらつかないようにしたり、細部まで美しく見えるように工夫されています。
とても興味深い技術ですね!これを応用したツール形が今後出てくると楽しそうです。
「Vidu4D」のプロジェクトページは公開済みですが、コード周りは間もなく公開(Code will be released soon.)とのこと。
コメント