
Qwq 32B Preview Gptqmodel 4bit Vortex V3
該產品是一個基於Qwen2.5-32B的4位量化語言模型,通過GPTQ技術實現高效推理和低資源消耗。它在保持較高性能的同時,顯著降低了模型的存儲和計算需求,適合在資源受限的環境中使用。該模型主要面向需要高性能語言生成的應用場景,如智能客服、編程輔助、內容創作等。其開源許可和靈活的部署方式使其在商業和研究領域具有廣泛的應用前景。
聊天機器人
56.3K

Internlm3
InternLM3 是由 InternLM 團隊開發的一系列高性能語言模型,專注於文本生成任務。該模型通過多種量化技術優化,能夠在不同硬件環境下高效運行,同時保持出色的生成質量。其主要優點包括高效的推理性能、多樣化的應用場景以及對多種文本生成任務的優化支持。InternLM3 適用於需要高質量文本生成的開發者和研究人員,能夠幫助他們在自然語言處理領域快速實現應用。
AI模型
47.5K

Voyage 3 Large
Voyage-3-large 是 Voyage AI 推出的最新多語言通用嵌入模型。該模型在法律、金融、代碼等八個領域的100個數據集中排名第一,超越了 OpenAI-v3-large 和 Cohere-v3-English。它通過 Matryoshka 學習和量化感知訓練,支持更小維度和 int8 及二進制量化,大幅降低向量數據庫成本,同時對檢索質量影響極小。該模型還支持 32K 令牌上下文長度,遠超 OpenAI(8K)和 Cohere(512)。
AI模型
62.7K

1.58 Bit FLUX
1.58-bit FLUX是一種先進的文本到圖像生成模型,通過使用1.58位權重(即{-1, 0, +1}中的值)來量化FLUX.1-dev模型,同時保持生成1024x1024圖像的可比性能。該方法無需訪問圖像數據,完全依賴於FLUX.1-dev模型的自監督。此外,開發了一種定製的內核,優化了1.58位操作,實現了模型存儲減少7.7倍,推理內存減少5.1倍,並改善了推理延遲。在GenEval和T2I Compbench基準測試中的廣泛評估表明,1.58-bit FLUX在保持生成質量的同時顯著提高了計算效率。
圖片生成
76.2K

Llama 3 Patronus Lynx 8B V1.1 Instruct Q8 GGUF
PatronusAI/Llama-3-Patronus-Lynx-8B-v1.1-Instruct-Q8-GGUF是一個基於Llama模型的量化版本,專為對話和幻覺檢測設計。該模型使用了GGUF格式,擁有8.03億參數,屬於大型語言模型。它的重要性在於能夠提供高質量的對話生成和幻覺檢測能力,同時保持模型的高效運行。該模型是基於Transformers庫和GGUF技術構建的,適用於需要高性能對話系統和內容生成的應用場景。
聊天機器人
43.9K

Qwen2.5 Coder 32B Instruct GGUF
Qwen2.5-Coder 是針對代碼生成的模型,在代碼生成等方面顯著提升,參數規模多樣,支持量化。免費,面向開發者提高效率和質量。
代碼推理
47.5K

Quantized Llama
Llama模型是Meta公司推出的大型語言模型,通過量化技術,使得模型體積更小、運行速度更快,同時保持了模型的質量和安全性。這些模型特別適用於移動設備和邊緣部署,能夠在資源受限的設備上提供快速的設備內推理,同時減少內存佔用。量化Llama模型的開發,標誌著在移動AI領域的一個重要進步,使得更多的開發者能夠在不需要大量計算資源的情況下,構建和部署高質量的AI應用。
模型訓練與部署
46.6K
優質新品

Torchao
torchao是PyTorch的一個庫,專注於自定義數據類型和優化,支持量化和稀疏化權重、梯度、優化器和激活函數,用於推理和訓練。它與torch.compile()和FSDP2兼容,能夠為大多數PyTorch模型提供加速。torchao旨在通過量化感知訓練(QAT)和後訓練量化(PTQ)等技術,提高模型的推理速度和內存效率,同時儘量減小精度損失。
AI開發助手
53.0K

Cog Flux
Cog inference for flux models 是一個用於FLUX.1 [schnell] 和 FLUX.1 [dev] 模型的推理引擎,由Black Forest Labs開發。它支持編譯與量化,敏感內容檢查,以及img2img支持,旨在提高圖像生成模型的性能和安全性。
AI圖像生成
59.3K

Nemotron Mini 4B Instruct
Nemotron-Mini-4B-Instruct 是 NVIDIA 開發的一款小型語言模型,通過蒸餾、剪枝和量化優化,以提高速度和便於在設備上部署。它是從 Nemotron-4 15B 通過 NVIDIA 的大型語言模型壓縮技術剪枝和蒸餾得到的 nvidia/Minitron-4B-Base 的微調版本。此指令模型針對角色扮演、檢索增強問答(RAG QA)和功能調用進行了優化,支持 4096 個令牌的上下文長度,已準備好用於商業用途。
AI模型
56.9K

Comfyui GGUF
ComfyUI-GGUF是一個為ComfyUI原生模型提供GGUF量化支持的項目。它允許模型文件以GGUF格式存儲,這種格式由llama.cpp推廣。儘管常規的UNET模型(conv2d)不適用於量化,但像flux這樣的transformer/DiT模型似乎受量化影響較小。這使得它們可以在低端GPU上以更低的每權重變量比特率進行運行。
AI模型
102.7K
國外精選

Vllm
vLLM是一個為大型語言模型(LLM)推理和提供服務的快速、易用且高效的庫。它通過使用最新的服務吞吐量技術、高效的內存管理、連續批處理請求、CUDA/HIP圖快速模型執行、量化技術、優化的CUDA內核等,提供了高性能的推理服務。vLLM支持與流行的HuggingFace模型無縫集成,支持多種解碼算法,包括並行採樣、束搜索等,支持張量並行性,適用於分佈式推理,支持流式輸出,併兼容OpenAI API服務器。此外,vLLM還支持NVIDIA和AMD GPU,以及實驗性的前綴緩存和多lora支持。
開發與工具
62.4K

Moodmap
MoodMap是一個用於測量ADHD症狀和干預措施的在線工具。它幫助用戶跟蹤和評估自己的注意力缺陷多動障礙症狀,並記錄他們使用的干預措施的效果。MoodMap的主要優點包括方便易用的界面,精確的測量結果,以及個性化的建議和反饋。它的背景信息包括ADHD的普遍存在和對個人日常生活和學習能力的影響。MoodMap定位於幫助那些希望更好管理他們ADHD症狀的人。
健康與醫療
51.9K
精選AI產品推薦
中文精選

騰訊混元圖像 2.0
騰訊混元圖像 2.0 是騰訊最新發布的 AI 圖像生成模型,顯著提升了生成速度和畫質。通過超高壓縮倍率的編解碼器和全新擴散架構,使得圖像生成速度可達到毫秒級,避免了傳統生成的等待時間。同時,模型通過強化學習算法與人類美學知識的結合,提升了圖像的真實感和細節表現,適合設計師、創作者等專業用戶使用。
圖片生成
80.9K
國外精選

Lovart
Lovart 是一款革命性的 AI 設計代理,能夠將創意提示轉化為藝術作品,支持從故事板到品牌視覺的多種設計需求。其重要性在於打破傳統設計流程,節省時間並提升創意靈感。Lovart 當前處於測試階段,用戶可加入等候名單,隨時體驗設計的樂趣。
AI設計工具
64.0K

Fastvlm
FastVLM 是一種高效的視覺編碼模型,專為視覺語言模型設計。它通過創新的 FastViTHD 混合視覺編碼器,減少了高分辨率圖像的編碼時間和輸出的 token 數量,使得模型在速度和精度上表現出色。FastVLM 的主要定位是為開發者提供強大的視覺語言處理能力,適用於各種應用場景,尤其在需要快速響應的移動設備上表現優異。
AI模型
51.1K

Keysync
KeySync 是一個針對高分辨率視頻的無洩漏唇同步框架。它解決了傳統唇同步技術中的時間一致性問題,同時通過巧妙的遮罩策略處理表情洩漏和麵部遮擋。KeySync 的優越性體現在其在唇重建和跨同步方面的先進成果,適用於自動配音等實際應用場景。
視頻編輯
48.6K

Manus
Manus 是由 Monica.im 研發的全球首款真正自主的 AI 代理產品,能夠直接交付完整的任務成果,而不僅僅是提供建議或答案。它採用 Multiple Agent 架構,運行在獨立虛擬機中,能夠通過編寫和執行代碼、瀏覽網頁、操作應用等方式直接完成任務。Manus 在 GAIA 基準測試中取得了 SOTA 表現,展現了強大的任務執行能力。其目標是成為用戶在數字世界的‘代理人’,幫助用戶高效完成各種複雜任務。
個人助理
1.5M

Trae國內版
Trae是一款專為中文開發場景設計的AI原生IDE,將AI技術深度集成於開發環境中。它通過智能代碼補全、上下文理解等功能,顯著提升開發效率和代碼質量。Trae的出現填補了國內AI集成開發工具的空白,滿足了中文開發者對高效開發工具的需求。其定位為高端開發工具,旨在為專業開發者提供強大的技術支持,目前尚未明確公開價格,但預計會採用付費模式以匹配其高端定位。
開發與工具
138.0K
國外精選

Pika
Pika是一個視頻製作平臺,用戶可以上傳自己的創意想法,Pika會自動生成相關的視頻。主要功能有:支持多種創意想法轉視頻,視頻效果專業,操作簡單易用。平臺採用免費試用模式,定位面向創意者和視頻愛好者。
視頻生成
18.7M
中文精選

Liblibai
LiblibAI是一箇中國領先的AI創作平臺,提供強大的AI創作能力,幫助創作者實現創意。平臺提供海量免費AI創作模型,用戶可以搜索使用模型進行圖像、文字、音頻等創作。平臺還支持用戶訓練自己的AI模型。平臺定位於廣大創作者用戶,致力於創造條件普惠,服務創意產業,讓每個人都享有創作的樂趣。
AI模型
8.0M