混合專家模型

# 混合專家模型

DeepEP

DeepEP 是一個專為混合專家模型（MoE）和專家並行（EP）設計的通信庫。它提供了高吞吐量和低延遲的全連接 GPU 內核，支持低精度操作（如 FP8）。該庫針對非對稱域帶寬轉發進行了優化，適合訓練和推理預填充任務。此外，它還支持流處理器（SM）數量控制，並引入了一種基於鉤子的通信-計算重疊方法，不佔用任何 SM 資源。DeepEP 的實現雖然與 DeepSeek-V3 論文略有差異，但其優化的內核和低延遲設計使其在大規模分佈式訓練和推理任務中表現出色。

開發與工具

Moonlight

Moonlight是基於Muon優化器訓練的16B參數混合專家模型（MoE），在大規模訓練中表現出色。它通過添加權重衰減和調整參數更新比例，顯著提高了訓練效率和穩定性。該模型在多項基準測試中超越了現有模型，同時大幅減少了訓練所需的計算量。Moonlight的開源實現和預訓練模型為研究人員和開發者提供了強大的工具，支持多種自然語言處理任務，如文本生成、代碼生成等。

DeepSeek-VL2-Small

Deepseek VL2 Small

DeepSeek-VL2是一系列先進的大型混合專家(MoE)視覺語言模型，相較於前代DeepSeek-VL有顯著提升。該模型系列在視覺問答、光學字符識別、文檔/表格/圖表理解以及視覺定位等多種任務上展現出卓越的能力。DeepSeek-VL2由三種變體組成：DeepSeek-VL2-Tiny、DeepSeek-VL2-Small和DeepSeek-VL2，分別擁有10億、28億和45億激活參數。DeepSeek-VL2在激活參數相似或更少的情況下，與現有的開源密集型和基於MoE的模型相比，達到了競爭性或最先進的性能。

Tencent-Hunyuan-Large

Tencent Hunyuan Large

Tencent-Hunyuan-Large（混元大模型）是由騰訊推出的業界領先的開源大型混合專家（MoE）模型，擁有3890億總參數和520億激活參數。該模型在自然語言處理、計算機視覺和科學任務等領域取得了顯著進展，特別是在處理長上下文輸入和提升長上下文任務處理能力方面表現出色。混元大模型的開源，旨在激發更多研究者的創新靈感，共同推動AI技術的進步和應用。

Aria

Aria是一個多模態原生混合專家模型，具有強大的多模態、語言和編碼任務性能。它在視頻和文檔理解方面表現出色，支持長達64K的多模態輸入，能夠在10秒內描述一個256幀的視頻。Aria模型的參數量為25.3B，能夠在單個A100（80GB）GPU上使用bfloat16精度進行加載。Aria的開發背景是滿足對多模態數據理解的需求，特別是在視頻和文檔處理方面。它是一個開源模型，旨在推動多模態人工智能的發展。

GRIN-MoE

GRIN-MoE是由微軟開發的混合專家(Mixture of Experts, MoE)模型，專注於提高模型在資源受限環境下的性能。該模型通過使用SparseMixer-v2來估計專家路由的梯度，與傳統的MoE訓練方法相比，GRIN-MoE在不依賴專家並行處理和令牌丟棄的情況下，實現了模型訓練的擴展。它在編碼和數學任務上表現尤為出色，適用於需要強推理能力的場景。

Yuan2.0-M32-hf-int8

Yuan2.0 M32 Hf Int8

Yuan2.0-M32-hf-int8是一個具有32個專家的混合專家(MoE)語言模型，其中2個是活躍的。該模型通過採用新的路由網絡——注意力路由器，提高了專家選擇的效率，使得準確率比使用傳統路由網絡的模型提高了3.8%。Yuan2.0-M32從頭開始訓練，使用了2000億個token，其訓練計算量僅為同等參數規模的密集模型所需計算量的9.25%。該模型在編程、數學和各種專業領域展現出競爭力，並且只使用37億個活躍參數，佔總參數40億的一小部分，每個token的前向計算僅為7.4 GFLOPS，僅為Llama3-70B需求的1/19。Yuan2.0-M32在MATH和ARC-Challenge基準測試中超越了Llama3-70B，分別達到了55.9%和95.8%的準確率。

Skywork-MoE-Base

Skywork MoE Base

Skywork-MoE-Base是一個具有1460億參數的高性能混合專家(MoE)模型，由16個專家組成，並激活了220億參數。該模型從Skywork-13B模型的密集型檢查點初始化而來，並引入了兩種創新技術：門控邏輯歸一化增強專家多樣化，以及自適應輔助損失係數，允許針對層特定調整輔助損失係數。Skywork-MoE在各種流行基準測試中表現出與參數更多或激活參數更多的模型相當的或更優越的性能。

phixtral-2x2_8

phixtral-2x2_8是第一個由兩個microsoft/phi-2模型製作的混合專家模型，受到mistralai/Mixtral-8x7B-v0.1架構的啟發。其性能優於每個單獨的專家模型。該模型在AGIEval、GPT4All、TruthfulQA、Bigbench等多個評估指標上表現優異。它採用了自定義版本的mergekit庫（mixtral分支）和特定配置。用戶可以在Colab notebook上以4位精度在免費的T4 GPU上運行Phixtral。模型大小為4.46B參數，張量類型為F16。

精選AI產品推薦

騰訊混元圖像 2.0

騰訊混元圖像 2.0

騰訊混元圖像 2.0 是騰訊最新發布的 AI 圖像生成模型，顯著提升了生成速度和畫質。通過超高壓縮倍率的編解碼器和全新擴散架構，使得圖像生成速度可達到毫秒級，避免了傳統生成的等待時間。同時，模型通過強化學習算法與人類美學知識的結合，提升了圖像的真實感和細節表現，適合設計師、創作者等專業用戶使用。

Lovart

Lovart 是一款革命性的 AI 設計代理，能夠將創意提示轉化為藝術作品，支持從故事板到品牌視覺的多種設計需求。其重要性在於打破傳統設計流程，節省時間並提升創意靈感。Lovart 當前處於測試階段，用戶可加入等候名單，隨時體驗設計的樂趣。

FastVLM

FastVLM 是一種高效的視覺編碼模型，專為視覺語言模型設計。它通過創新的 FastViTHD 混合視覺編碼器，減少了高分辨率圖像的編碼時間和輸出的 token 數量，使得模型在速度和精度上表現出色。FastVLM 的主要定位是為開發者提供強大的視覺語言處理能力，適用於各種應用場景，尤其在需要快速響應的移動設備上表現優異。

KeySync

KeySync 是一個針對高分辨率視頻的無洩漏唇同步框架。它解決了傳統唇同步技術中的時間一致性問題，同時通過巧妙的遮罩策略處理表情洩漏和麵部遮擋。KeySync 的優越性體現在其在唇重建和跨同步方面的先進成果，適用於自動配音等實際應用場景。

Manus

Manus 是由 Monica.im 研發的全球首款真正自主的 AI 代理產品，能夠直接交付完整的任務成果，而不僅僅是提供建議或答案。它採用 Multiple Agent 架構，運行在獨立虛擬機中，能夠通過編寫和執行代碼、瀏覽網頁、操作應用等方式直接完成任務。Manus 在 GAIA 基準測試中取得了 SOTA 表現，展現了強大的任務執行能力。其目標是成為用戶在數字世界的‘代理人’，幫助用戶高效完成各種複雜任務。

Trae國內版

Trae是一款專為中文開發場景設計的AI原生IDE，將AI技術深度集成於開發環境中。它通過智能代碼補全、上下文理解等功能，顯著提升開發效率和代碼質量。Trae的出現填補了國內AI集成開發工具的空白，滿足了中文開發者對高效開發工具的需求。其定位為高端開發工具，旨在為專業開發者提供強大的技術支持，目前尚未明確公開價格，但預計會採用付費模式以匹配其高端定位。

開發與工具

Pika

Pika是一個視頻製作平臺,用戶可以上傳自己的創意想法,Pika會自動生成相關的視頻。主要功能有:支持多種創意想法轉視頻,視頻效果專業,操作簡單易用。平臺採用免費試用模式,定位面向創意者和視頻愛好者。

LiblibAI

LiblibAI是一箇中國領先的AI創作平臺,提供強大的AI創作能力,幫助創作者實現創意。平臺提供海量免費AI創作模型,用戶可以搜索使用模型進行圖像、文字、音頻等創作。平臺還支持用戶訓練自己的AI模型。平臺定位於廣大創作者用戶,致力於創造條件普惠,服務創意產業,讓每個人都享有創作的樂趣。

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase