
Fastapply 7B V1.0
FastApply-7B-v1.0 是一個專為代碼編輯任務設計的大型語言模型。它基於 Qwen2.5 Coder 架構,經過微調以實現快速、準確的代碼修改功能。該模型能夠快速生成完整的文件編輯,支持即時代碼應用任務,特別適合集成到 AI 驅動的代碼編輯器中。它在部署時表現出高吞吐量和高編輯準確率,速度可達約 150 tokens/second。該模型由 Kortix 開發,採用 Apache-2.0 許可證,旨在通過快速應用流程為數據生成和模型微調提供支持。
代碼助手
52.4K

RAG FiT
RAG-FiT是一個強大的工具,旨在通過檢索增強生成(RAG)技術提升大型語言模型(LLMs)的能力。它通過創建專門的RAG增強數據集,幫助模型更好地利用外部信息。該庫支持從數據準備到模型訓練、推理和評估的全流程操作。其主要優點包括模塊化設計、可定製化工作流以及對多種RAG配置的支持。RAG-FiT基於開源許可,適合研究人員和開發者進行快速原型開發和實驗。
模型訓練與部署
52.4K

Paligemma2 3b Pt 448
PaliGemma 2是一個由Google開發的視覺-語言模型,繼承了Gemma 2模型的能力,能夠處理圖像和文本輸入並生成文本輸出。該模型在多種視覺語言任務上表現出色,如圖像描述、視覺問答等。其主要優點包括強大的多語言支持、高效的訓練架構和廣泛的適用性。該模型適用於需要處理視覺和文本數據的各種應用場景,如社交媒體內容生成、智能客服等。
AI模型
47.7K

Bakery
Bakery是一個專注於開源AI模型的微調與變現的在線平臺,為AI初創企業、機器學習工程師和研究人員提供了一個便捷的工具,使他們能夠輕鬆地對AI模型進行微調,並在市場中進行變現。該平臺的主要優點在於其簡單易用的界面和強大的功能,用戶可以快速創建或上傳數據集,微調模型設置,並在市場中進行變現。Bakery的背景信息表明,它旨在推動開源AI技術的發展,併為開發者提供更多的商業機會。雖然具體的定價信息未在頁面中明確展示,但其定位是為AI領域的專業人士提供一個高效的工具。
模型訓練與部署
59.1K

Bespoke Labs
Bespoke Labs專注於提供高質量的定製化數據集服務,以支持工程師進行精確的模型微調。公司由Google DeepMind的前員工Mahesh和UT Austin的Alex共同創立,旨在改善高質量數據的獲取,這對於推動領域發展至關重要。Bespoke Labs提供的工具和平臺,如Minicheck、Evalchemy和Curator,都是圍繞數據集的創建和管理設計的,以提高數據的質量和模型的性能。
模型訓練與部署
56.0K

Mwp ReFT
ReFT是一個開源的研究項目,旨在通過深度強化學習技術對大型語言模型進行微調,以提高其在特定任務上的表現。該項目提供了詳細的代碼和數據,以便研究人員和開發者能夠復現論文中的結果。ReFT的主要優點包括能夠利用強化學習自動調整模型參數,以及通過微調提高模型在特定任務上的性能。產品背景信息顯示,ReFT基於Codellama和Galactica模型,遵循Apache2.0許可證。
模型訓練與部署
56.6K
中文精選

智譜清流
智譜清流AI開放平臺是一個企業級AI智能體開發平臺,利用智譜大模型技術,幫助企業快速構建專業級智能體,實現大模型到業務場景的快速應用。平臺提供模型服務、智能體構建、數據安全、效果評測和系統集成等功能,支持企業通過內網部署和本地存儲保護數據,確保數據安全和知識產權。智譜AI開放平臺以其領先的技術、靈活的工作流編排、自主調用企業定義的數據知識和工具,以及成熟的AI原生應用落地經驗,成為企業數字化轉型的重要助力。
開發平臺
104.6K

SFR Judge
SFR-Judge 是 Salesforce AI Research 推出的一系列評估模型,旨在通過人工智能技術加速大型語言模型(LLMs)的評估和微調過程。這些模型能夠執行多種評估任務,包括成對比較、單項評分和二元分類,同時提供解釋,避免黑箱問題。SFR-Judge 在多個基準測試中表現優異,證明了其在評估模型輸出和指導微調方面的有效性。
AI模型
46.4K

Diffusion E2e Ft
diffusion-e2e-ft是一個開源的圖像條件擴散模型微調工具,它通過微調預訓練的擴散模型來提高特定任務的性能。該工具支持多種模型和任務,如深度估計和法線估計,並提供了詳細的使用說明和模型檢查點。它在圖像處理和計算機視覺領域具有重要應用,能夠顯著提升模型在特定任務上的準確性和效率。
AI圖像生成
53.8K

Prem
Prem是一個加速個性化LLM(小型語言模型)發展的人工智能平臺。它提供了一個直觀易用的開發平臺,用於構建生成式AI解決方案。Prem還提供了定製化的模型微調和訓練服務,以滿足獨特的業務需求。通過Prem,用戶可以獲得對AI的最大潛力的掌控和所有權,而無需深入的專業知識。
開發平臺
45.8K
優質新品

Llama Chinese
Llama中文社區是一個專注於Llama模型在中文方面的優化和上層建設的技術社區。社區提供基於大規模中文數據的預訓練模型,並對Llama2和Llama3模型進行持續的中文能力迭代升級。社區擁有高級工程師團隊支持,豐富的社區活動,以及開放共享的合作環境,旨在推動中文自然語言處理技術的發展。
AI模型
72.9K

Xtuner
XTuner是一個為大型模型(如InternLM, Llama, Baichuan, Qwen, ChatGLM)設計的高效、靈活且功能齊全的微調工具包。它支持在幾乎所有GPU上進行LLM和VLM的預訓練和微調,能夠自動調度高性能操作,如FlashAttention和Triton內核,以提高訓練吞吐量。XTuner與DeepSpeed兼容,支持多種ZeRO優化技術。它還支持各種LLMs和VLM(如LLaVA),並設計了良好的數據管道,能夠適應任何格式的數據集。此外,XTuner支持多種訓練算法,包括QLoRA、LoRA和全參數微調,使用戶能夠選擇最適合其需求的解決方案。
AI開發助手
51.9K

Mindeye2
MindEye2項目展示瞭如何僅用1小時的fMRI數據,在多個受試者上預訓練模型後,在新受試者上進行微調,以實現視覺感知重建。
AI圖像生成
61.3K

Cappy
Cappy是一種新型方法,旨在提高大型多任務語言模型的性能和效率。它是一個輕量級的預訓練評分器,基於RoBERTa,僅有3.6億個參數。Cappy可獨立解決分類任務,或作為輔助組件提升語言模型性能。在下游任務中微調Cappy,可有效整合監督信息,提高模型表現,且不需要反向傳播到語言模型參數,降低了內存需求。Cappy適用於開源和封閉源代碼的語言模型,是一種高效的模型微調方法。
AI模型
48.3K

ALMA 13B R
ALMA-R模型,通過Contrastive Preference Optimization (CPO)進行了進一步的LoRA微調,超越了GPT-4和WMT獲獎者。用戶可以在GitHub倉庫中下載ALMA(-R)模型和數據集。ALMA-R建立在ALMA模型的基礎上,採用了我們提出的Contrastive Preference Optimization (CPO)進行微調,而不是ALMA中使用的Supervised Fine-tuning。CPO微調需要我們的三元組偏好數據進行偏好學習。ALMA-R現在可以匹配甚至超越GPT-4或WMT獲獎者!
AI模型
56.0K

Llava 3b
LLaVA-3b是一種基於Dolphin 2.6 Phi進行微調的模型,使用SigLIP 400M的視覺塔以LLaVA方式進行微調。模型具有多個圖像標記、使用視覺編碼器的最新層輸出等特點。此模型基於Phi-2,受微軟研究許可證約束,禁止商業使用。感謝ML Collective提供的計算資源積分。
AI模型
56.9K

Windows AI Studio
Windows AI Studio通過彙集來自Azure AI Studio和其他目錄(如Hugging Face)的尖端AI開發工具和模型,簡化了生成式AI應用程序的開發。它使開發人員能夠對本地應用程序中使用的最新小語言模型(SLMs)進行微調、定製和部署。它提供端到端的引導式工作區設置,包括模型配置UI和引導式步驟,以微調流行的SLMs(如Phi)和最先進的模型(如Llama 2和Mistral)。
AI開發助手
70.9K
精選AI產品推薦
中文精選

騰訊混元圖像 2.0
騰訊混元圖像 2.0 是騰訊最新發布的 AI 圖像生成模型,顯著提升了生成速度和畫質。通過超高壓縮倍率的編解碼器和全新擴散架構,使得圖像生成速度可達到毫秒級,避免了傳統生成的等待時間。同時,模型通過強化學習算法與人類美學知識的結合,提升了圖像的真實感和細節表現,適合設計師、創作者等專業用戶使用。
圖片生成
83.1K
國外精選

Lovart
Lovart 是一款革命性的 AI 設計代理,能夠將創意提示轉化為藝術作品,支持從故事板到品牌視覺的多種設計需求。其重要性在於打破傳統設計流程,節省時間並提升創意靈感。Lovart 當前處於測試階段,用戶可加入等候名單,隨時體驗設計的樂趣。
AI設計工具
65.7K

Fastvlm
FastVLM 是一種高效的視覺編碼模型,專為視覺語言模型設計。它通過創新的 FastViTHD 混合視覺編碼器,減少了高分辨率圖像的編碼時間和輸出的 token 數量,使得模型在速度和精度上表現出色。FastVLM 的主要定位是為開發者提供強大的視覺語言處理能力,適用於各種應用場景,尤其在需要快速響應的移動設備上表現優異。
AI模型
52.7K

Keysync
KeySync 是一個針對高分辨率視頻的無洩漏唇同步框架。它解決了傳統唇同步技術中的時間一致性問題,同時通過巧妙的遮罩策略處理表情洩漏和麵部遮擋。KeySync 的優越性體現在其在唇重建和跨同步方面的先進成果,適用於自動配音等實際應用場景。
視頻編輯
50.0K

Manus
Manus 是由 Monica.im 研發的全球首款真正自主的 AI 代理產品,能夠直接交付完整的任務成果,而不僅僅是提供建議或答案。它採用 Multiple Agent 架構,運行在獨立虛擬機中,能夠通過編寫和執行代碼、瀏覽網頁、操作應用等方式直接完成任務。Manus 在 GAIA 基準測試中取得了 SOTA 表現,展現了強大的任務執行能力。其目標是成為用戶在數字世界的‘代理人’,幫助用戶高效完成各種複雜任務。
個人助理
1.5M

Trae國內版
Trae是一款專為中文開發場景設計的AI原生IDE,將AI技術深度集成於開發環境中。它通過智能代碼補全、上下文理解等功能,顯著提升開發效率和代碼質量。Trae的出現填補了國內AI集成開發工具的空白,滿足了中文開發者對高效開發工具的需求。其定位為高端開發工具,旨在為專業開發者提供強大的技術支持,目前尚未明確公開價格,但預計會採用付費模式以匹配其高端定位。
開發與工具
140.8K
國外精選

Pika
Pika是一個視頻製作平臺,用戶可以上傳自己的創意想法,Pika會自動生成相關的視頻。主要功能有:支持多種創意想法轉視頻,視頻效果專業,操作簡單易用。平臺採用免費試用模式,定位面向創意者和視頻愛好者。
視頻生成
18.7M
中文精選

Liblibai
LiblibAI是一箇中國領先的AI創作平臺,提供強大的AI創作能力,幫助創作者實現創意。平臺提供海量免費AI創作模型,用戶可以搜索使用模型進行圖像、文字、音頻等創作。平臺還支持用戶訓練自己的AI模型。平臺定位於廣大創作者用戶,致力於創造條件普惠,服務創意產業,讓每個人都享有創作的樂趣。
AI模型
8.0M