3D建模

# 3D建模

AI Doll

AI Doll利用先進的AI技術，通過GPT 4.0生成圖像，將您的文本描述轉化為精美的實體動作人偶。通過AI圖像生成、3D建模和專業打印，AI Doll提供全面的AI動作人偶製作解決方案。

MIDI

MIDI是一種創新的圖像到3D場景生成技術，它利用多實例擴散模型，能夠從單張圖像中直接生成具有準確空間關係的多個3D實例。該技術的核心在於其多實例注意力機制，能夠有效捕捉物體間的交互和空間一致性，無需複雜的多步驟處理。MIDI在圖像到場景生成領域表現出色，適用於合成數據、真實場景數據以及由文本到圖像擴散模型生成的風格化場景圖像。其主要優點包括高效性、高保真度和強大的泛化能力。

Funes

Funes是一個創新的在線博物館項目，通過眾包攝影測量技術將全球人類建築轉化為3D模型，旨在創建一個免費、可訪問的龐大3D數據庫。該項目以阿根廷作家博爾赫斯筆下的'博聞強記的福內斯'命名，象徵著對人類物質記憶的永恆保存。Funes不僅是一個技術展示平臺，更是一個文化傳承項目，通過數字化手段保護人類文明的建築遺產。

Shapen

Shapen是一款創新的在線工具，它利用先進的圖像處理和3D建模技術，將2D圖像轉化為詳細的3D模型。這一技術對於設計師、藝術家和創意工作者來說是一個巨大的突破，因為它極大地簡化了3D模型的創建過程，降低了3D建模的門檻。用戶無需深厚的3D建模知識，只需上傳圖片，即可快速生成可用於渲染、動畫製作或3D打印的模型。Shapen的出現，為創意表達和產品設計帶來了全新的可能性，其定價策略和市場定位也使其成為個人創作者和小型工作室的理想選擇。

Stable Point Aware 3D

Stable Point Aware 3D

Stable Point Aware 3D (SPAR3D) 是 Stability AI 推出的先進3D生成模型。它能夠在不到一秒的時間內，從單張圖像中實現3D對象的即時編輯和完整結構生成。SPAR3D採用獨特的架構，結合精確的點雲採樣與先進的網格生成技術，為3D資產創建提供了前所未有的控制力。該模型免費提供給商業和非商業用途，可在Hugging Face下載權重，GitHub獲取代碼，或通過Stability AI開發者平臺API訪問。

Text-to-CAD UI

Text-to-CAD UI是一個利用自然語言提示生成B-Rep CAD文件和網格的平臺。它通過ML-ephant API，由Zoo提供支持，能夠將用戶的自然語言描述直接轉化為精確的CAD模型。這項技術的重要性在於它極大地簡化了設計過程，使得非專業人士也能輕鬆創建複雜的CAD模型，從而推動了設計的民主化和創新。產品背景信息顯示，它是由Zoo開發的，旨在通過機器學習技術提升設計效率。關於價格和定位，用戶需要登錄後才能獲取更多信息。

Explorer

Explorer是由Odyssey推出的生成式世界模型，旨在通過人工智能技術加速電影和遊戲世界的創造過程，並開啟全新的娛樂形式。該技術由皮克斯聯合創始人Ed Catmull支持，代表了電影、遊戲以及更廣泛娛樂領域中的下一個重大技術突破。Explorer能夠將任何圖像轉化為詳細的3D世界，具有生成逼真世界的能力，並且支持手動編輯，以適應不同的創作需求。

IC-Light V2-Vary

IC Light V2 Vary

IC-Light V2-Vary是一款基於擴散模型的光照編輯工具，主要針對複雜光照場景中的圖像生成和編輯問題，提供了光照一致性約束、大規模數據支持、精確光照編輯等功能。它通過物理光傳輸理論確保物體在不同光照條件下的表現可以線性組合，減少圖像偽影，保持輸出結果與實際物理光照條件一致。適用於攝影師、設計師及3D建模專業人士，同時為藝術創作者提供了更多可能性。

LLaMA-Mesh

LLaMA-Mesh是一項將大型語言模型（LLMs）預訓練在文本上擴展到生成3D網格的能力的技術。這項技術利用了LLMs中已經嵌入的空間知識，並實現了對話式3D生成和網格理解。LLaMA-Mesh的主要優勢在於它能夠將3D網格的頂點座標和麵定義表示為純文本，允許與LLMs直接集成而無需擴展詞彙表。該技術的主要優點包括能夠從文本提示生成3D網格、按需產生交錯的文本和3D網格輸出，以及理解和解釋3D網格。LLaMA-Mesh在保持強大的文本生成性能的同時，實現了與從頭開始訓練的模型相當的網格生成質量。

Snapdragon X Series

Snapdragon X Series

Snapdragon X Series是高通推出的新一代產品系列，通過搭載神經處理單元（NPU），為創作者提供了強大的AI算力。這一系列產品能夠顯著提升移動設備在圖像處理、音頻製作和3D建模等方面的性能，同時延長電池續航，為用戶提供前所未有的移動創作體驗。Snapdragon X Series的推出，標誌著移動設備在創意工作領域的一次重大飛躍，使得專業級的創作工具可以隨時隨地被使用。

開發與工具

GGHead

GGHead是一種基於3D高斯散射表示的3D生成對抗網絡（GAN），用於從2D圖像集合中學習3D頭部先驗。該技術通過利用模板頭部網格的UV空間的規則性，預測一組3D高斯屬性，從而簡化了預測過程。GGHead的主要優點包括高效率、高分辨率生成、全3D一致性，並且能夠實現即時渲染。它通過一種新穎的總變差損失來提高生成的3D頭部的幾何保真度，確保鄰近渲染像素來自UV空間中相近的高斯。

Kanai

Kanai是一個在線設計平臺，允許用戶通過3D掃描和模型創建來設計他們夢想中的家。用戶可以導入房間和傢俱的3D模型，分享他們的設計願景，並與他人協作。Kanai利用先進的3D技術，為用戶提供了一個直觀且互動性強的設計體驗，幫助他們將想象變為現實。

A Diffusion Approach to Radiance Field Relighting using Multi-Illumination Synthesis

A Diffusion Approach To Radiance Field Relighting Using Multi Illumination Synthesis

這是一種通過利用從2D圖像擴散模型提取的先驗來創建可重新照明的輻射場的方法。該方法能夠將單照明條件下捕獲的多視圖數據轉換為具有多照明效果的數據集，並通過3D高斯splats表示可重新照明的輻射場。這種方法不依賴於精確的幾何形狀和表面法線，因此更適合處理具有複雜幾何形狀和反射BRDF的雜亂場景。

Stability AI

Stability AI是一個專注於生成式人工智能技術的公司，提供多種AI模型，包括文本到圖像、視頻、音頻、3D和語言模型。這些模型能夠處理複雜提示，生成逼真的圖像和視頻，以及高質量的音樂和音效。公司提供靈活的許可選項，包括自託管許可和平臺API，以滿足不同用戶的需求。Stability AI致力於通過開放模型，為全球每個人提供高質量的AI服務。

World Labs

World Labs 是一家專注於空間智能的公司，致力於構建大型世界模型（Large World Models），以感知、生成和與3D世界進行互動。公司由AI領域的知名科學家、教授、學者和行業領導者共同創立，包括斯坦福大學的Fei-Fei Li教授、密歇根大學的Justin Johnson教授等。他們通過創新的技術和方法，如神經輻射場（NeRF）技術，推動了3D場景重建和新視角合成的發展。World Labs 得到了包括Marc Benioff、Jim Breyer等知名投資者的支持，其技術在AI領域具有重要的應用價值和商業潛力。

Render Artist

Render Artist 是一個展示數字藝術作品的平臺，包括3D建模、動畫、AI生成藝術等。它為藝術家提供了一個展示他們從草圖到成品渲染作品的空間，同時也為觀眾提供了欣賞和學習數字藝術的機會。該平臺強調創意和技術的結合，展示了數字藝術的多樣性和創新性。

HeadGAP

HeadGAP是一個先進的3D頭像創建模型，它能夠從少量甚至單張目標人物的圖片中創建出逼真且可動畫化的3D頭像。該模型通過利用大規模多視角動態數據集來學習3D頭部先驗知識，並通過高斯Splatting基礎的自解碼網絡實現動態建模。HeadGAP通過身份共享編碼和個性化潛在代碼來學習高斯原語的屬性，實現了快速的頭像個性化定製。

Prompt3D

Prompt3D是一個在線平臺，允許用戶通過簡單的文本提示來生成3D模型。這項技術結合了人工智能和3D建模，使得設計過程更加快速和直觀。它適用於需要快速原型設計和3D可視化的專業人士和愛好者。

SF3D

SF3D是一個基於深度學習的3D資產生成模型，它能夠從單張圖片中快速生成具有UV展開和材質參數的帶紋理3D模型。與傳統方法相比，SF3D特別針對網格生成進行了訓練，集成了快速UV展開技術，能夠迅速生成紋理而不是依賴頂點顏色。此外，該模型還能學習材質參數和法線貼圖，以提高重建模型的視覺質量。SF3D還引入了一個去照明步驟，有效去除低頻照明效果，確保重建的網格在新的照明條件下易於使用。

Stable Fast 3D

Stable Fast 3D (SF3D) 是一個基於TripoSR的大型重建模型，能夠從單張物體圖片生成帶有紋理的UV展開3D網格資產。該模型訓練有素，能在不到一秒的時間內創建3D模型，具有較低的多邊形計數，並且進行了UV展開和紋理處理，使得模型在下游應用如遊戲引擎或渲染工作中更易於使用。此外，模型還能預測每個物體的材料參數（粗糙度、金屬感），在渲染過程中增強反射行為。SF3D適用於需要快速3D建模的領域，如遊戲開發、電影特效製作等。

LLaVA-NeXT

LLaVA-NeXT是一個大型多模態模型，它通過統一的交錯數據格式處理多圖像、視頻、3D和單圖像數據，展示了在不同視覺數據模態上的聯合訓練能力。該模型在多圖像基準測試中取得了領先的結果，並在不同場景中通過適當的數據混合提高了之前單獨任務的性能或保持了性能。

CharacterGen

CharacterGen是一個高效的3D角色生成框架，能夠從單張輸入圖片生成具有高質量和一致外觀的3D姿勢統一的角色網格。它通過流線化的生成管道和圖像條件多視圖擴散模型，有效校準輸入姿勢到規範形式，同時保留輸入圖像的關鍵屬性，解決了多樣化姿勢帶來的挑戰。它還採用了基於變換器的通用稀疏視圖重建模型，以及紋理反投影策略，生成高質量的紋理圖。

GaussianCube

GaussianCube是一種創新的3D輻射表示方法，它通過結構化和顯式的表示方式，極大地促進了三維生成建模的發展。該技術通過使用一種新穎的密度約束高斯擬合算法和最優傳輸方法，將高斯函數重新排列到預定義的體素網格中，從而實現了高精度的擬合。與傳統的隱式特徵解碼器或空間無結構的輻射表示相比，GaussianCube具有更少的參數和更高的質量，使得3D生成建模變得更加容易。

ID-to-3D

ID-to-3D是一種創新的方法，它能夠從一張隨意拍攝的野外圖片中生成具有身份和文本引導的3D人頭模型，具有分離的表情。該方法基於組合性，使用特定任務的2D擴散模型作為優化的先驗。通過擴展基礎模型並添加輕量級的表情感知和身份感知架構，創建了2D先驗，用於幾何和紋理生成，並通過微調僅0.2%的可用訓練參數。結合強大的面部身份嵌入和神經表示，該方法不僅能夠準確重建面部特徵，還能重建配飾和頭髮，並可提供適用於遊戲和遠程呈現的渲染就緒資產。

Unique3D

Unique3D是由清華大學團隊開發的一項技術，能夠從單張圖片中生成高保真度的紋理3D網格模型。這項技術在圖像處理和3D建模領域具有重要意義，它使得用戶能夠快速將2D圖像轉化為3D模型，為遊戲開發、動畫製作、虛擬現實等領域提供了強大的技術支持。

CAT3D

CAT3D是一個利用多視角擴散模型從任意數量的輸入圖像生成新視角的3D場景的網站。它通過一個強大的3D重建管道，將生成的視圖轉化為可交互渲染的3D表示。整個處理時間（包括視圖生成和3D重建）僅需一分鐘。

IntrinsicAnything

Intrinsicanything

IntrinsicAnything 是一種先進的圖像逆渲染技術，它通過學習擴散模型來優化材質恢復過程，解決了在未知靜態光照條件下捕獲的圖像中物體材質恢復的問題。該技術通過生成模型學習材質先驗，將渲染方程分解為漫反射和鏡面反射項，利用現有豐富的3D物體數據進行訓練，有效地解決了逆渲染過程中的歧義問題。此外，該技術還開發了一種從粗到細的訓練策略，利用估計的材質引導擴散模型產生多視圖一致性約束，從而獲得更穩定和準確的結果。

InstantMesh

InstantMesh是一個基於LRM架構的前饋框架，用於從單張圖像高效生成3D網格。它支持低內存GPU環境，並能生成具有紋理映射的3D網格模型。

123kanfang.com

123看房是國內主流看房技術方案的定義者，通過全景照片進行3D建模技術的始創者。提供在線VR看房與虛擬家裝的技術，可以通過全景圖生成3D模型。其技術創造了低成本、高效率、易操作的全景看房和虛擬家裝方案。該產品適用於房地產行業，可以實現遠程看房、720全景、商業空間等多種功能。

PhysAvatar

PhysAvatar是一個結合逆向渲染和逆向物理的創新框架,可以從多視角視頻數據中自動估計人體形狀、外表以及服裝的物理參數。它採用網格對齊的4D高斯時空網格跟蹤技術和基於物理的逆向渲染器來估計內在的材料屬性。PhysAvatar集成了物理模擬器,使用基於梯度的優化方法以原理性的方式估計服裝的物理參數。這些創新能力使PhysAvatar能夠在訓練數據之外的運動和照明條件下,渲染出高質量的穿著寬鬆衣服的新視角頭像。

精選AI產品推薦

騰訊混元圖像 2.0

騰訊混元圖像 2.0

騰訊混元圖像 2.0 是騰訊最新發布的 AI 圖像生成模型，顯著提升了生成速度和畫質。通過超高壓縮倍率的編解碼器和全新擴散架構，使得圖像生成速度可達到毫秒級，避免了傳統生成的等待時間。同時，模型通過強化學習算法與人類美學知識的結合，提升了圖像的真實感和細節表現，適合設計師、創作者等專業用戶使用。

Lovart

Lovart 是一款革命性的 AI 設計代理，能夠將創意提示轉化為藝術作品，支持從故事板到品牌視覺的多種設計需求。其重要性在於打破傳統設計流程，節省時間並提升創意靈感。Lovart 當前處於測試階段，用戶可加入等候名單，隨時體驗設計的樂趣。

FastVLM

FastVLM 是一種高效的視覺編碼模型，專為視覺語言模型設計。它通過創新的 FastViTHD 混合視覺編碼器，減少了高分辨率圖像的編碼時間和輸出的 token 數量，使得模型在速度和精度上表現出色。FastVLM 的主要定位是為開發者提供強大的視覺語言處理能力，適用於各種應用場景，尤其在需要快速響應的移動設備上表現優異。

KeySync

KeySync 是一個針對高分辨率視頻的無洩漏唇同步框架。它解決了傳統唇同步技術中的時間一致性問題，同時通過巧妙的遮罩策略處理表情洩漏和麵部遮擋。KeySync 的優越性體現在其在唇重建和跨同步方面的先進成果，適用於自動配音等實際應用場景。

Manus

Manus 是由 Monica.im 研發的全球首款真正自主的 AI 代理產品，能夠直接交付完整的任務成果，而不僅僅是提供建議或答案。它採用 Multiple Agent 架構，運行在獨立虛擬機中，能夠通過編寫和執行代碼、瀏覽網頁、操作應用等方式直接完成任務。Manus 在 GAIA 基準測試中取得了 SOTA 表現，展現了強大的任務執行能力。其目標是成為用戶在數字世界的‘代理人’，幫助用戶高效完成各種複雜任務。

Trae國內版

Trae是一款專為中文開發場景設計的AI原生IDE，將AI技術深度集成於開發環境中。它通過智能代碼補全、上下文理解等功能，顯著提升開發效率和代碼質量。Trae的出現填補了國內AI集成開發工具的空白，滿足了中文開發者對高效開發工具的需求。其定位為高端開發工具，旨在為專業開發者提供強大的技術支持，目前尚未明確公開價格，但預計會採用付費模式以匹配其高端定位。

開發與工具

Pika

Pika是一個視頻製作平臺,用戶可以上傳自己的創意想法,Pika會自動生成相關的視頻。主要功能有:支持多種創意想法轉視頻,視頻效果專業,操作簡單易用。平臺採用免費試用模式,定位面向創意者和視頻愛好者。

LiblibAI

LiblibAI是一箇中國領先的AI創作平臺,提供強大的AI創作能力,幫助創作者實現創意。平臺提供海量免費AI創作模型,用戶可以搜索使用模型進行圖像、文字、音頻等創作。平臺還支持用戶訓練自己的AI模型。平臺定位於廣大創作者用戶,致力於創造條件普惠,服務創意產業,讓每個人都享有創作的樂趣。

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase