

Long LRM
紹介 :
Long-LRMは、一連の入力画像から大規模シーンを再構築するための3Dガウス再構築モデルです。このモデルは、960x540ピクセルの解像度を持つ32枚のソース画像を1.3秒で処理し、単一のA100 80G GPU上で動作します。最新のMamba2モジュールと従来のTransformerモジュールを組み合わせ、効率的なトークンマージとガウシアン刈り込みの手順により、品質を維持しながら効率性を向上させています。従来のフィードフォワードモデルと比較して、Long-LRMはシーンの一部ではなく、一度にシーン全体を再構築できます。DL3DV-140やTanks and Templesなどの大規模シーンデータセットでは、Long-LRMの性能は最適化ベースの方法と匹敵し、同時に効率性は2桁向上しています。
ターゲットユーザー :
3Dモデラー、ゲーム開発者、VRコンテンツ制作者、そして高速かつ効率的な3Dシーン再構築を必要とするあらゆる専門家を対象としています。Long-LRMの高効率性と高品質な再構築能力により、これらのユーザーは短時間でリアルな3Dシーンを作成し、製品開発プロセスを加速させ、作業効率を向上させることができます。
使用シナリオ
Long-LRMを使用して、一連の街並み画像から3D都市モデルを高速に再構築する。
ゲーム開発において、実写画像からLong-LRMを用いてゲームシーンを再構築し、シーンのリアルさを向上させる。
VRコンテンツ制作者が、多角的に撮影された画像からLong-LRMを使用して高精度の仮想環境を再構築する。
製品特徴
最大32枚の高解像度入力画像を処理し、高速な3Dシーン再構築を実現
Mamba2ブロックとTransformerブロックの混合アーキテクチャを採用し、トークン処理能力を向上
トークンマージとガウシアン刈り込みの手順により、再構築品質と効率性のバランスを最適化
一度のフィードフォワードステップでシーン全体を再構築し、複数回の反復処理は不要
大規模シーンデータセットにおいて、最適化手法と同等の性能を実現
2桁の効率向上により、計算資源消費を大幅削減
幅広いビューカバレッジと高品質な写真レベルのリアリティのある再構築をサポート
使用チュートリアル
1. 再構築対象のシーンの入力画像を準備します。解像度は960x540以上にしてください。
2. A100 80G GPUなどの互換性のあるGPUハードウェアを確保してください。
3. 入力画像とLong-LRMモデルを計算環境に読み込みます。
4. トークンマージ戦略やガウシアン刈り込み閾値など、モデルパラメータを設定します。
5. Long-LRMモデルを実行し、モデルが入力画像を処理して3D再構築結果を生成するのを待ちます。
6. 再構築された3Dシーンを確認し、必要に応じて後処理や最適化を行います。
7. 3Dプリント、VR、ゲーム開発など、必要な分野に再構築された3Dシーンを適用します。
おすすめAI製品
海外精選

Luma AI
Luma AIは、AI技術に特化した企業です。革新的な技術により、ユーザーはスマートフォンを使って必要な3Dモデルを迅速に生成できます。豊富な3Dコンピュータビジョン経験を持つチームによって設立され、その技術はNeural Radiance Fieldsに基づいており、少数の2D画像から3Dシーンをモデリングできます。Dream Machineは、テキストと画像から直接、高品質でリアルなビデオを迅速に生成できるAIモデルです。ビデオ用に特化してトレーニングされた、高度に拡張可能で効率的なトランスフォーマーモデルであり、物理的に正確で一貫性があり、イベントに満ちた映像を生成できます。Dream Machineは、汎用的な想像力エンジンを構築する第一歩であり、現在誰でも利用できます。
3Dモデリング
3.6M

Elicit
Elicitは、研究論文を驚くべき速度で分析できるAIアシスタントです。論文要約、データ抽出、研究結果の統合など、煩雑なリサーチ作業を自動化します。関連論文の検索、1文要約の取得、論文からの詳細情報の抽出と整理、主題や概念の特定などが可能です。高い精度と使いやすさで、多くの研究者から信頼と好評を得ています。
研究機器
599.2K