Long LRM : 大規模シーンの高速再構築を実現する高効率3Dガウス再構築モデル

Long LRM

3Dモデリング研究機器 #3D再構築 #ガウスモデル #画像処理 #機械学習 #深層学習通常製品オープンソース

紹介 :

Long-LRMは、一連の入力画像から大規模シーンを再構築するための3Dガウス再構築モデルです。このモデルは、960x540ピクセルの解像度を持つ32枚のソース画像を1.3秒で処理し、単一のA100 80G GPU上で動作します。最新のMamba2モジュールと従来のTransformerモジュールを組み合わせ、効率的なトークンマージとガウシアン刈り込みの手順により、品質を維持しながら効率性を向上させています。従来のフィードフォワードモデルと比較して、Long-LRMはシーンの一部ではなく、一度にシーン全体を再構築できます。DL3DV-140やTanks and Templesなどの大規模シーンデータセットでは、Long-LRMの性能は最適化ベースの方法と匹敵し、同時に効率性は2桁向上しています。

ターゲットユーザー :

3Dモデラー、ゲーム開発者、VRコンテンツ制作者、そして高速かつ効率的な3Dシーン再構築を必要とするあらゆる専門家を対象としています。Long-LRMの高効率性と高品質な再構築能力により、これらのユーザーは短時間でリアルな3Dシーンを作成し、製品開発プロセスを加速させ、作業効率を向上させることができます。

総訪問数： 1.9K

最も高い割合の地域： US(100.00%)

ウェブサイト閲覧数： 51.9K

使用シナリオ

Long-LRMを使用して、一連の街並み画像から3D都市モデルを高速に再構築する。

ゲーム開発において、実写画像からLong-LRMを用いてゲームシーンを再構築し、シーンのリアルさを向上させる。

VRコンテンツ制作者が、多角的に撮影された画像からLong-LRMを使用して高精度の仮想環境を再構築する。

製品特徴

最大32枚の高解像度入力画像を処理し、高速な3Dシーン再構築を実現

Mamba2ブロックとTransformerブロックの混合アーキテクチャを採用し、トークン処理能力を向上

トークンマージとガウシアン刈り込みの手順により、再構築品質と効率性のバランスを最適化

一度のフィードフォワードステップでシーン全体を再構築し、複数回の反復処理は不要