

Xiaomi MiMo
简介 :
Xiaomi MiMo是小米公司开源的首个推理大模型,专为推理任务设计,具备卓越的数学推理和代码生成能力。该模型在数学推理(AIME 24-25)和代码竞赛(LiveCodeBench v5)公开测评集上表现出色,仅用7B的参数规模就超越了OpenAI的o1-mini和阿里Qwen的QwQ-32B-Preview等更大规模的模型。MiMo通过预训练和后训练阶段的多层面创新,包括数据挖掘、训练策略和强化学习算法等,显著提升了推理能力。该模型的开源为研究人员和开发者提供了强大的工具,推动了人工智能在推理领域的进一步发展。
需求人群 :
Xiaomi MiMo适合需要高效推理能力的研究人员、开发者和企业。其强大的数学推理和代码生成能力使其在学术研究、软件开发、数据分析和教育等领域具有广泛的应用前景。对于研究人员来说,MiMo提供了强大的推理工具,有助于推动人工智能在推理领域的研究。对于开发者而言,MiMo可以集成到各种应用中,提升应用的智能水平。对于企业来说,MiMo可以用于优化业务流程,提高决策效率。
使用场景
研究人员可以使用MiMo进行复杂的数学推理研究,提升模型在数学问题上的表现。
开发者可以将MiMo集成到代码编辑器中,为程序员提供实时代码建议和优化方案。
企业可以利用MiMo的推理能力优化业务流程,例如在金融领域进行风险评估和预测。
产品特色
预训练阶段,着重挖掘富推理语料,合成约200B tokens推理数据,确保模型见过更多推理模式。
进行三阶段训练,逐步提升训练难度,总训练量达到25T tokens,全面提升模型的推理能力。
在后训练阶段,提出Test Difficulty Driven Reward策略,缓解困难算法问题中的奖励稀疏问题,引入Easy Data Re-Sampling策略,稳定RL训练。
设计Seamless Rollout系统,加速RL训练和验证,分别提升2.29倍和1.96倍的效率。
在数学推理和代码竞赛公开测评集上,MiMo-7B的性能显著领先于其他同规模模型。
MiMo-7B全系列已开源,提供4个模型至HuggingFace,方便研究人员和开发者使用。
技术细节已在GitHub公开,包括完整的训练报告和技术文档,方便社区交流和进一步研究。
MiMo模型由小米大模型Core团队开发,展示了小米在人工智能领域的创新能力和技术实力。
使用教程
访问HuggingFace上的MiMo模型页面:
下载并安装所需的MiMo模型版本。
使用HuggingFace提供的API或工具加载模型,并进行推理任务。
根据需要对模型进行微调,以适应特定的推理任务或数据集。
利用MiMo的技术报告和文档,深入了解模型的训练细节和使用技巧。
精选AI产品推荐

Deepmind Gemini
Gemini是谷歌DeepMind推出的新一代人工智能系统。它能够进行多模态推理,支持文本、图像、视频、音频和代码之间的无缝交互。Gemini在语言理解、推理、数学、编程等多个领域都超越了之前的状态,成为迄今为止最强大的AI系统之一。它有三个不同规模的版本,可满足从边缘计算到云计算的各种需求。Gemini可以广泛应用于创意设计、写作辅助、问题解答、代码生成等领域。
AI模型
11.4M
中文精选

Liblibai
LiblibAI是一个中国领先的AI创作平台,提供强大的AI创作能力,帮助创作者实现创意。平台提供海量免费AI创作模型,用户可以搜索使用模型进行图像、文字、音频等创作。平台还支持用户训练自己的AI模型。平台定位于广大创作者用户,致力于创造条件普惠,服务创意产业,让每个人都享有创作的乐趣。
AI模型
8.0M