

Long LRM
简介 :
Long-LRM是一个用于3D高斯重建的模型,能够从一系列输入图像中重建出大场景。该模型能在1.3秒内处理32张960x540分辨率的源图像,并且仅在单个A100 80G GPU上运行。它结合了最新的Mamba2模块和传统的transformer模块,通过高效的token合并和高斯修剪步骤,在保证质量的同时提高了效率。与传统的前馈模型相比,Long-LRM能够一次性重建整个场景,而不是仅重建场景的一小部分。在大规模场景数据集上,如DL3DV-140和Tanks and Temples,Long-LRM的性能可与基于优化的方法相媲美,同时效率提高了两个数量级。
需求人群 :
目标受众为3D建模师、游戏开发者、虚拟现实内容创作者以及任何需要快速高效3D场景重建的专业人士。Long-LRM的高效率和高质量的重建能力,使得这些用户能够在短时间内创建出逼真的3D场景,加速产品开发流程,提高工作效率。
使用场景
使用Long-LRM从一系列城市街景图片中快速重建出3D城市模型。
在游戏开发中,利用Long-LRM从实拍图片中重建游戏场景,提高场景的真实感。
虚拟现实内容创作者使用Long-LRM从多角度拍摄的图片中重建出高精度的虚拟环境。
产品特色
处理高达32张高分辨率输入图像,实现快速3D场景重建
采用Mamba2块和transformer块的混合架构,提高token处理能力
通过token合并和高斯修剪步骤,平衡重建质量和效率
单次前馈步骤即可重建整个场景,无需多次迭代
在大规模场景数据集上具有与优化方法相媲美的性能
提高了两个数量级的效率,显著减少计算资源消耗
支持广泛的视图覆盖和高质量的照片级真实感重建
使用教程
1. 准备一系列待重建场景的输入图像,分辨率至少为960x540。
2. 确保拥有兼容的GPU硬件,如A100 80G GPU。
3. 将输入图像和Long-LRM模型一同加载到计算环境中。
4. 配置模型参数,包括token合并策略和高斯修剪阈值。
5. 运行Long-LRM模型,等待模型处理输入图像并生成3D重建结果。
6. 查看和评估重建的3D场景,根据需要进行后处理和优化。
7. 将重建的3D场景应用于所需的领域,如3D打印、虚拟现实或游戏开发。
精选AI产品推荐
国外精选

Luma AI
Luma AI是一家专注于AI的技术公司,通过其创新技术,用户可以利用手机快速生成所需的3D模型。公司由拥有丰富3D计算机视觉经验的团队成立,其技术基于Neural Radiance Fields,能够基于少量2D图像对3D场景进行建模。Dream Machine是一个AI模型,能够直接从文本和图像快速生成高质量的逼真视频。它是一个高度可扩展且高效的transformer模型,专门针对视频进行训练,能够生成物理上准确、一致且充满事件的镜头。Dream Machine是构建通用想象力引擎的第一步,现已对所有人开放。
3D建模
3.9M

Elicit
Elicit是一款能够以超人速度分析研究论文的AI助手。它可以自动完成繁琐的研究任务,如论文摘要、数据提取和综合研究发现。用户可以搜索相关论文、获取一句话摘要、从论文中提取详细信息并进行整理、寻找主题和概念等。Elicit的准确度高,使用方便,已受到广大研究者的信赖和好评。
研究工具
629.6K