# 開源

OmniAvatar
Omniavatar
OmniAvatar 是一種先進的音頻驅動視頻生成模型,能夠生成高質量的虛擬形象動畫。其重要性在於結合了音頻和視覺內容,實現高效的身體動畫,適用於各種應用場景。該技術利用深度學習算法,實現高保真的動畫生成,支持多種輸入形式,定位於影視、遊戲和社交領域。該模型是開源的,促進了技術的共享與應用。
視頻生成
42.2K
Dyad
Dyad
Dyad是一款強大的應用構建工具,採用開源技術,用戶可以自由定製和構建AI應用。其主要優點包括靈活性高、功能強大、支持本地開發和定製化。
開發與工具
37.8K
NativeMind
Nativemind
NativeMind是一個在設備上運行的私密AI助手,通過連接到Ollama本地LLMs,將最新的AI功能帶到您喜愛的瀏覽器中,無需向雲服務器發送任何數據。它完全開源,具有審計能力、透明度和社區支持。NativeMind旨在提供高效的本地AI支持,使用戶能夠獲得最新的智能技術,保持數據安全和控制權。
個人助理
41.7K
優質新品
OmniGen2
Omnigen2
OmniGen2 是一個高效的多模態生成模型,結合了視覺語言模型和擴散模型,能夠實現視覺理解、圖像生成及編輯等功能。其開源特性為研究人員和開發者提供了強大的基礎,助力個性化和可控生成 AI 的探索。
圖片生成
38.1K
Kimi-Dev
Kimi Dev
Kimi-Dev 是一款強大的開源編碼 LLM,旨在解決軟件工程中的問題。它通過大規模強化學習優化,確保在真實開發環境中的正確性和穩健性。Kimi-Dev-72B 在 SWE-bench 驗證中實現了 60.4% 的性能,超越其他開源模型,是目前最先進的編碼 LLM 之一。該模型可在 Hugging Face 和 GitHub 上下載和部署,適合開發者和研究人員使用。
編程
37.8K
PandaWiki
Pandawiki
PandaWiki 是一款基於 AI 大模型的開源知識庫搭建系統,旨在幫助用戶快速構建智能化的產品文檔和技術文檔。它的主要優勢在於能夠通過 AI 技術提供智能創作、問答和搜索能力,極大提升了文檔管理和用戶體驗。適合希望利用 AI 提升工作效率的團隊和企業。
知識庫
39.2K
Chatterbox AI
Chatterbox AI
Chatterbox 是 Resemble AI 推出的第一個開源生產級文本轉語音 (TTS) 模型,具有卓越的性能和穩定性。它經過與頂尖閉源系統的比較,展現出更優的效果。該模型的獨特之處在於它支持情感誇張控制,適用於製作視頻、遊戲、AI 代理等多種場景。Chatterbox 的價格競爭力強,同時提供超低延遲,適合生產使用。
文本轉語音
38.1K
DeepSeek R1-0528
Deepseek R1 0528
DeepSeek R1-0528 是知名開源大模型平臺 DeepSeek 發佈的最新版本,具有高性能的自然語言處理和編程能力。它的發佈引起了廣泛關注,因其在編程任務中表現出色,能夠準確回答複雜問題。該模型支持多種應用場景,是開發者和 AI 研究者的重要工具。預計後續將發佈更詳細的模型信息和使用指南,增強其功能和應用廣度。
AI
40.3K
Unmute
Unmute
Unmute 是一款創新的語音識別與合成工具,旨在使用戶能夠通過自然語言與 AI 進行高效的互動。其低延遲技術確保用戶體驗流暢,適合需要即時反饋的場景。該產品將以開源形式發佈,推動更多開發者和用戶的參與。當前尚未公佈價格,預計將採取免費和付費相結合的模式。
文本轉語音
38.1K
DMind
Dmind
DMind-1 和 DMind-1-mini 是針對 Web3 任務的領域專用大型語言模型,提供比其他通用模型更高的領域準確性、指令跟隨能力及專業理解。DMind-1 經過專家策劃的 Web3 數據微調,並通過強化學習與人類反饋對齊,適合複雜指令和多輪對話,適用於區塊鏈、DeFi 和智能合約等領域。DMind-1-mini 作為更輕量的版本,旨在滿足即時和資源高效的應用場景,特別適合代理部署和鏈上工具。產品定價及具體信息需進一步確認。
AI模型
44.4K
優質新品
Minion Agent
Minion Agent
Minion Agent 是一個簡單而強大的代理框架,能夠與瀏覽器交互,支持深度研究、自動規劃等功能,適用於需要進行復雜任務和研究的用戶。它提供了一種靈活的工具集,使開發者能夠輕鬆集成不同的模型和工具。該框架不僅提高了工作的效率,還為用戶提供了便捷的使用體驗,適合各類科研和商業應用。該產品是開源的,用戶可以自由使用和修改。
開發與工具
45.5K
OpenMemory MCP
Openmemory MCP
OpenMemory 是一個開放源代碼的個人記憶層,為大型語言模型(LLMs)提供私密、可攜帶的記憶管理。它確保用戶對自己的數據擁有完全的控制權,能夠在構建 AI 應用程序時保持數據的安全性。此項目支持 Docker、Python 和 Node.js,適合開發者進行個性化的 AI 體驗。OpenMemory 尤其適合希望在不洩露個人信息的情況下使用 AI 的用戶。
知識管理
60.7K
AgentCPM-GUI
Agentcpm GUI
AgentCPM-GUI 是一款開源的手機端大型語言模型(LLM)代理,專為操作中英文應用程序而設計,能夠根據用戶的屏幕截圖自動執行任務。其主要優點在於高效的 GUI 元素理解、增強的推理能力以及對中文應用的精準支持。此技術的開發背景是為了提升移動設備上智能代理的用戶體驗,特別是在複雜任務處理方面。該產品定位於提高移動端的生產力,適用於各類用戶。
個人助理
50.0K
SurfSense
Surfsense
SurfSense 是一款開源的 AI 研究助手,它將多種外部資源(如搜索引擎、Slack、Notion 等)整合在一起,幫助用戶高效地進行研究和信息管理。該產品支持多種文件格式的上傳與搜索,具備自然語言交互能力,並能快速生成內容。SurfSense 旨在提升研究效率,適合對知識管理有高需求的用戶。
研究工具
46.1K
Seed-Coder
Seed Coder
Seed-Coder 是字節跳動 Seed 團隊推出的開源代碼大型語言模型系列,包含基礎、指令和推理模型,旨在通過最小的人力投入,自主管理代碼訓練數據,從而顯著提升編程能力。該模型在同類開源模型中表現優越,適合於各種編碼任務,定位於推動開源 LLM 生態的發展,適用於研究和工業界。
代碼助手
42.8K
DeerFlow
Deerflow
DeerFlow 是一個深度研究框架,旨在結合語言模型與如網頁搜索、爬蟲及 Python 執行等專用工具,以推動深入研究工作。該項目源於開源社區,強調貢獻回饋,具備多種靈活的功能,適合各類研究需求。
研究工具
48.6K
NoteLLM
Notellm
NoteLLM 是一款專注於用戶生成內容的可檢索大型語言模型,旨在提升推薦系統的性能。通過將主題生成與嵌入生成相結合,NoteLLM 提高了對筆記內容的理解與處理能力。該模型採用了端到端的微調策略,適用於多模態輸入,增強了在多樣化內容領域的應用潛力。其重要性在於能夠有效提升筆記推薦的準確性和用戶體驗,特別適用於小紅書等 UGC 平臺。
AI模型
46.1K
Agent-as-a-Judge
Agent As A Judge
Agent-as-a-Judge 是一種新型的自動化評估系統,旨在通過代理系統的互相評估來提高工作效率和質量。該產品能夠顯著減少評估時間和成本,同時提供持續的反饋信號,促進代理系統的自我改進。它被廣泛應用於 AI 開發任務中,特別是在代碼生成領域。該系統具備開源特性,便於開發者進行二次開發和定製。
開發與工具
46.1K
Excel MCP Server
Excel MCP Server
Excel MCP Server 是一個無須安裝 Microsoft Excel 即可操作 Excel 文件的服務器,用戶可以創建、讀取和修改 Excel 工作簿。該工具的主要優點在於它的易用性和靈活性,支持多種 Excel 功能,並可通過 AI 代理進行文件操作。此產品適合需要頻繁處理 Excel 文件的用戶,如數據分析師、財務人員等。此工具是開源的,使用 Python 開發,便於在本地或遠程服務器上運行。
數據分析
194.6K
Ubicloud
Ubicloud
Ubicloud是一個開源雲平臺,可在任何地方運行。它提供彈性計算、塊存儲、負載均衡器、防火牆、託管PostgreSQL和GitHub Actions運行器。通過自託管軟件或使用託管服務,可將雲成本降低3-10倍。
開源
38.6K
Zarin
Zarin
Zarin是一個開源AI平臺,匯聚了200多個熱門和最新的AI多模型,為用戶提供生成圖片、視頻、音頻、代碼、學術論文等功能。該平臺的主要優點是打破了不同AI平臺之間切換的障礙,使用戶能夠在一個平臺上完成多種任務。Zarin的背景信息是由Ibrohim Abdivokhidov開發。
開源
38.6K
DeepSeek-Prover-V2-671B
Deepseek Prover V2 671B
DeepSeek-Prover-V2-671B 是一個先進的人工智能模型,旨在提供強大的推理能力。它基於最新的技術,適用於多種應用場景。該模型是開源的,旨在促進人工智能技術的民主化與普及,降低技術壁壘,使更多開發者和研究者能夠利用 AI 技術進行創新。通過使用該模型,用戶可以提升他們的工作效率,推動各類項目的進展。
AI模型
84.2K
國外精選
F Lite
F Lite
F Lite 是由 Freepik 和 Fal 開發的一個大型擴散模型,具有 100 億個參數,專門訓練於版權安全和適合工作環境 (SFW) 的內容。該模型基於 Freepik 的內部數據集,包含約 8000 萬張合法合規的圖像,標誌著公開可用的模型在這一規模上首次專注於合法和安全的內容。它的技術報告提供了詳細的模型信息,並且使用了 CreativeML Open RAIL-M 許可證進行分發。該模型的設計旨在推動人工智能的開放性和可用性。
圖片生成
57.1K
Simular
Simular
Simular 是一款領先的開放源代碼計算機使用代理,通過人類般的計算機操作來自動化多種數字任務,提升工作效率。該產品由來自 DeepMind、Google 和 Baidu 等頂尖 AI 研究機構的專家團隊開發,旨在通過開放的代理框架實現透明且可控的業務集成。
自動化工作流
42.0K
國外精選
Step1X-Edit
Step1x Edit
Step1X-Edit 是一種實用的通用圖像編輯框架,利用 MLLMs 的圖像理解能力解析編輯指令,生成編輯令牌,並通過 DiT 網絡解碼為圖像。其重要性在於能夠有效滿足真實用戶的編輯需求,提升了圖像編輯的便捷性和靈活性。
圖片編輯
54.1K
RepoCloud
Repocloud
RepoCloud是一個開源應用雲市場,讓用戶能夠輕鬆部署和擴展他們喜愛的開源應用。它提供一鍵部署功能,並且價格僅為主流雲主機的一半,旨在降低用戶的部署和運營成本。
部署
38.1K
Kimi-Audio
Kimi Audio
Kimi-Audio 是一個先進的開源音頻基礎模型,旨在處理多種音頻處理任務,如語音識別和音頻對話。該模型在超過 1300 萬小時的多樣化音頻數據和文本數據上進行了大規模預訓練,具有強大的音頻推理和語言理解能力。它的主要優點包括優秀的性能和靈活性,適合研究人員和開發者進行音頻相關的研究與開發。
語音識別
74.8K
deepwiki
Deepwiki
devops-exercises 是一個旨在幫助求職者準備 DevOps 面試的資源庫。它包含了各種技術和工具的練習題,幫助用戶提高自己的技能和麵試表現。該項目是開源的,適合所有希望在 DevOps 領域發展的人員。它涵蓋了包括 Docker、Kubernetes、AWS 等熱門技術,適合初學者和有經驗的專業人士。該項目的使用完全免費,促進了社區的學習與成長。
求職
41.1K
國外精選
Flex.2-preview
Flex.2 Preview
Flex.2 是當前最靈活的文本到圖像擴散模型,具備內置的重繪和通用控制功能。它是一個開源項目,由社區支持,旨在推動人工智能的民主化。Flex.2 具備 8 億參數,支持 512 個令牌長度輸入,並符合 OSI 的 Apache 2.0 許可證。此模型可以在許多創意項目中提供強大的支持。用戶可以通過反饋不斷改善模型,推動技術進步。
圖片生成
93.3K
國外精選
Dia AI
Dia AI
Dia 是一個由 Nari Labs 開發的文本到語音(TTS)模型,具有 1.6 億參數,能夠直接從文本生成高度逼真的對話。該模型支持情感和語調控制,並能夠生成非言語交流,如笑聲和咳嗽。它的預訓練模型權重託管在 Hugging Face 上,適用於英語生成。此產品對於研究和教育用途至關重要,能夠推動對話生成技術的發展。
文本轉聲音
98.0K
精選AI產品推薦
中文精選
騰訊混元圖像 2.0
騰訊混元圖像 2.0
騰訊混元圖像 2.0 是騰訊最新發布的 AI 圖像生成模型,顯著提升了生成速度和畫質。通過超高壓縮倍率的編解碼器和全新擴散架構,使得圖像生成速度可達到毫秒級,避免了傳統生成的等待時間。同時,模型通過強化學習算法與人類美學知識的結合,提升了圖像的真實感和細節表現,適合設計師、創作者等專業用戶使用。
圖片生成
80.6K
國外精選
Lovart
Lovart
Lovart 是一款革命性的 AI 設計代理,能夠將創意提示轉化為藝術作品,支持從故事板到品牌視覺的多種設計需求。其重要性在於打破傳統設計流程,節省時間並提升創意靈感。Lovart 當前處於測試階段,用戶可加入等候名單,隨時體驗設計的樂趣。
AI設計工具
63.8K
FastVLM
Fastvlm
FastVLM 是一種高效的視覺編碼模型,專為視覺語言模型設計。它通過創新的 FastViTHD 混合視覺編碼器,減少了高分辨率圖像的編碼時間和輸出的 token 數量,使得模型在速度和精度上表現出色。FastVLM 的主要定位是為開發者提供強大的視覺語言處理能力,適用於各種應用場景,尤其在需要快速響應的移動設備上表現優異。
AI模型
51.1K
KeySync
Keysync
KeySync 是一個針對高分辨率視頻的無洩漏唇同步框架。它解決了傳統唇同步技術中的時間一致性問題,同時通過巧妙的遮罩策略處理表情洩漏和麵部遮擋。KeySync 的優越性體現在其在唇重建和跨同步方面的先進成果,適用於自動配音等實際應用場景。
視頻編輯
48.0K
Manus
Manus
Manus 是由 Monica.im 研發的全球首款真正自主的 AI 代理產品,能夠直接交付完整的任務成果,而不僅僅是提供建議或答案。它採用 Multiple Agent 架構,運行在獨立虛擬機中,能夠通過編寫和執行代碼、瀏覽網頁、操作應用等方式直接完成任務。Manus 在 GAIA 基準測試中取得了 SOTA 表現,展現了強大的任務執行能力。其目標是成為用戶在數字世界的‘代理人’,幫助用戶高效完成各種複雜任務。
個人助理
1.5M
Trae國內版
Trae國內版
Trae是一款專為中文開發場景設計的AI原生IDE,將AI技術深度集成於開發環境中。它通過智能代碼補全、上下文理解等功能,顯著提升開發效率和代碼質量。Trae的出現填補了國內AI集成開發工具的空白,滿足了中文開發者對高效開發工具的需求。其定位為高端開發工具,旨在為專業開發者提供強大的技術支持,目前尚未明確公開價格,但預計會採用付費模式以匹配其高端定位。
開發與工具
137.4K
國外精選
Pika
Pika
Pika是一個視頻製作平臺,用戶可以上傳自己的創意想法,Pika會自動生成相關的視頻。主要功能有:支持多種創意想法轉視頻,視頻效果專業,操作簡單易用。平臺採用免費試用模式,定位面向創意者和視頻愛好者。
視頻生成
18.7M
中文精選
LiblibAI
Liblibai
LiblibAI是一箇中國領先的AI創作平臺,提供強大的AI創作能力,幫助創作者實現創意。平臺提供海量免費AI創作模型,用戶可以搜索使用模型進行圖像、文字、音頻等創作。平臺還支持用戶訓練自己的AI模型。平臺定位於廣大創作者用戶,致力於創造條件普惠,服務創意產業,讓每個人都享有創作的樂趣。
AI模型
8.0M
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase