Yuan2 M32 Hf Int4 : 高效能的混合专家语言模型

Yuan2 M32 Hf Int4

AI模型 AI语言模型 #混合专家 #注意力路由器 #高效能 #编程 #数学 #专业领域普通产品开源

简介 :

Yuan2.0-M32是一个具有32个专家的混合专家(MoE)语言模型，其中2个处于活跃状态。引入了新的路由网络——注意力路由器，以提高专家选择的效率，使模型在准确性上比使用传统路由器网络的模型提高了3.8%。Yuan2.0-M32从头开始训练，使用了2000亿个token，其训练计算量仅为同等参数规模密集型模型所需计算量的9.25%。在编码、数学和各种专业领域表现出竞争力，Yuan2.0-M32在总参数40亿中只有3.7亿活跃参数，每个token的前向计算量为7.4 GFLOPS，仅为Llama3-70B需求的1/19。Yuan2.0-M32在MATH和ARC-Challenge基准测试中超越了Llama3-70B，准确率分别达到了55.9%和95.8%。

需求人群 :

Yuan2.0-M32模型适用于需要处理大量数据和复杂计算任务的开发者和研究人员，特别是在编程、数学计算和专业领域知识的应用中。它的高效能和较低的计算需求使其成为大规模语言模型应用的理想选择。

总访问量： 29.7M

占比最多地区： US(17.94%)

本站浏览量： 50.0K

使用场景

在编程领域，Yuan2.0-M32可以用于代码生成和代码质量评估。

在数学领域，模型可以进行复杂的数学问题求解和逻辑推理。

在专业领域，如医疗或法律，Yuan2.0-M32可以辅助专业人士进行知识检索和文档分析。

产品特色

混合专家(MoE)模型，具有32个专家，其中2个活跃。

使用注意力路由器进行更高效的专家选择。