Long LRM : 高效3D高斯重建模型，实现大场景快速重建

Long LRM

Long-LRM

Long LRM

3D建模研究工具 #3D重建 #高斯模型 #图像处理 #机器学习 #深度学习普通产品开源

简介 :

Long-LRM是一个用于3D高斯重建的模型，能够从一系列输入图像中重建出大场景。该模型能在1.3秒内处理32张960x540分辨率的源图像，并且仅在单个A100 80G GPU上运行。它结合了最新的Mamba2模块和传统的transformer模块，通过高效的token合并和高斯修剪步骤，在保证质量的同时提高了效率。与传统的前馈模型相比，Long-LRM能够一次性重建整个场景，而不是仅重建场景的一小部分。在大规模场景数据集上，如DL3DV-140和Tanks and Temples，Long-LRM的性能可与基于优化的方法相媲美，同时效率提高了两个数量级。

需求人群 :

目标受众为3D建模师、游戏开发者、虚拟现实内容创作者以及任何需要快速高效3D场景重建的专业人士。Long-LRM的高效率和高质量的重建能力，使得这些用户能够在短时间内创建出逼真的3D场景，加速产品开发流程，提高工作效率。

总访问量： 247

占比最多地区： US(100.00%)

本站浏览量： 62.7K

使用场景

使用Long-LRM从一系列城市街景图片中快速重建出3D城市模型。

在游戏开发中，利用Long-LRM从实拍图片中重建游戏场景，提高场景的真实感。

虚拟现实内容创作者使用Long-LRM从多角度拍摄的图片中重建出高精度的虚拟环境。

产品特色

处理高达32张高分辨率输入图像，实现快速3D场景重建

采用Mamba2块和transformer块的混合架构，提高token处理能力

通过token合并和高斯修剪步骤，平衡重建质量和效率

单次前馈步骤即可重建整个场景，无需多次迭代

在大规模场景数据集上具有与优化方法相媲美的性能

提高了两个数量级的效率，显著减少计算资源消耗

支持广泛的视图覆盖和高质量的照片级真实感重建

使用教程

1. 准备一系列待重建场景的输入图像，分辨率至少为960x540。

2. 确保拥有兼容的GPU硬件，如A100 80G GPU。

3. 将输入图像和Long-LRM模型一同加载到计算环境中。

4. 配置模型参数，包括token合并策略和高斯修剪阈值。

5. 运行Long-LRM模型，等待模型处理输入图像并生成3D重建结果。

6. 查看和评估重建的3D场景，根据需要进行后处理和优化。

7. 将重建的3D场景应用于所需的领域，如3D打印、虚拟现实或游戏开发。

精选AI产品推荐

Luma AI

Luma AI是一家专注于AI的技术公司，通过其创新技术，用户可以利用手机快速生成所需的3D模型。公司由拥有丰富3D计算机视觉经验的团队成立，其技术基于Neural Radiance Fields，能够基于少量2D图像对3D场景进行建模。Dream Machine是一个AI模型，能够直接从文本和图像快速生成高质量的逼真视频。它是一个高度可扩展且高效的transformer模型，专门针对视频进行训练，能够生成物理上准确、一致且充满事件的镜头。Dream Machine是构建通用想象力引擎的第一步，现已对所有人开放。

Elicit

Elicit是一款能够以超人速度分析研究论文的AI助手。它可以自动完成繁琐的研究任务，如论文摘要、数据提取和综合研究发现。用户可以搜索相关论文、获取一句话摘要、从论文中提取详细信息并进行整理、寻找主题和概念等。Elicit的准确度高，使用方便，已受到广大研究者的信赖和好评。

AIbase

智启未来，您的人工智能解决方案智库

English 简体中文繁體中文にほんご

© 2025AIbase