Skywork MoE : 146億參數的高性能MoE模型

Skywork MoE

Skywork-MoE

Skywork MoE

AI模型 AI 模型推理訓練 #MoE模型 #大規模語言模型 #門控邏輯歸一化 #自適應輔助損失係數優質新品開源

簡介 :

Skywork-MoE是一個具有146億參數的高性能混合專家(MoE)模型，包含16個專家和22億激活參數。該模型從Skywork-13B模型的密集型檢查點初始化而來，並引入了兩種創新技術：門控邏輯歸一化增強專家多樣化，以及自適應輔助損失係數允許層特定的輔助損失係數調整。Skywork-MoE在性能上與參數更多或激活參數更多的模型如Grok-1、DBRX、Mistral 8*22和Deepseek-V2相當或更優。

需求人群 :

Skywork-MoE模型適合需要處理大規模語言模型訓練和推理的研究人員和開發者。它的高參數量和專家多樣化技術使其在處理複雜語言任務時表現出色，同時自適應輔助損失係數的調整能力允許模型針對特定層進行優化，提高模型性能和效率。

總訪問量： 474.6M

佔比最多地區： US(19.34%)

本站瀏覽量： 54.1K

使用場景

在C-Eval、MMLU、CMMLU等流行基準測試上的評估

使用HuggingFace進行Skywork-MoE-Base模型的推理示例

基於vLLM的Skywork-MoE-Base模型快速部署示例

產品特色

Gating Logit Normalization技術，增強專家多樣化

Adaptive Auxiliary Loss Coefficients技術，允許層特定的輔助損失係數調整

與Hugging Face、ModelScope、Wisemodel等平臺兼容

支持在8xA100/A800或更高GPU硬件配置上進行推理

提供vLLM模型推理的快速部署方法

支持fp8精度，可在8*4090上運行Skywork-MoE-Base模型

提供詳細的技術報告和社區許可協議

使用教程

安裝必要的依賴，包括pytorch-nightly版本和vllm-flash-attn

克隆Skywork提供的vllm源代碼

根據本地環境配置並編譯安裝vllm

使用docker運行vllm，設置模型路徑和工作目錄

通過vllm的LLM類和SamplingParams類進行文本生成

精選AI產品推薦

Deepmind Gemini

Deepmind Gemini

Gemini是谷歌DeepMind推出的新一代人工智能系統。它能夠進行多模態推理,支持文本、圖像、視頻、音頻和代碼之間的無縫交互。Gemini在語言理解、推理、數學、編程等多個領域都超越了之前的狀態,成為迄今為止最強大的AI系統之一。它有三個不同規模的版本,可滿足從邊緣計算到雲計算的各種需求。Gemini可以廣泛應用於創意設計、寫作輔助、問題解答、代碼生成等領域。

LiblibAI

LiblibAI是一箇中國領先的AI創作平臺,提供強大的AI創作能力,幫助創作者實現創意。平臺提供海量免費AI創作模型,用戶可以搜索使用模型進行圖像、文字、音頻等創作。平臺還支持用戶訓練自己的AI模型。平臺定位於廣大創作者用戶,致力於創造條件普惠,服務創意產業,讓每個人都享有創作的樂趣。

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase