Xiaomi MiMo : 小米首个推理大模型MiMo开源，专为推理任务设计，性能卓越。

Xiaomi MiMo

AI模型代码助手 #"推理模型、人工智能、开源、数学推理、代码生成、强化学习"优质新品开源

简介 :

Xiaomi MiMo是小米公司开源的首个推理大模型，专为推理任务设计，具备卓越的数学推理和代码生成能力。该模型在数学推理（AIME 24-25）和代码竞赛（LiveCodeBench v5）公开测评集上表现出色，仅用7B的参数规模就超越了OpenAI的o1-mini和阿里Qwen的QwQ-32B-Preview等更大规模的模型。MiMo通过预训练和后训练阶段的多层面创新，包括数据挖掘、训练策略和强化学习算法等，显著提升了推理能力。该模型的开源为研究人员和开发者提供了强大的工具，推动了人工智能在推理领域的进一步发展。

需求人群 :

Xiaomi MiMo适合需要高效推理能力的研究人员、开发者和企业。其强大的数学推理和代码生成能力使其在学术研究、软件开发、数据分析和教育等领域具有广泛的应用前景。对于研究人员来说，MiMo提供了强大的推理工具，有助于推动人工智能在推理领域的研究。对于开发者而言，MiMo可以集成到各种应用中，提升应用的智能水平。对于企业来说，MiMo可以用于优化业务流程，提高决策效率。

总访问量： 0

本站浏览量： 98.3K

使用场景

研究人员可以使用MiMo进行复杂的数学推理研究，提升模型在数学问题上的表现。

开发者可以将MiMo集成到代码编辑器中，为程序员提供实时代码建议和优化方案。

企业可以利用MiMo的推理能力优化业务流程，例如在金融领域进行风险评估和预测。

产品特色

预训练阶段，着重挖掘富推理语料，合成约200B tokens推理数据，确保模型见过更多推理模式。

进行三阶段训练，逐步提升训练难度，总训练量达到25T tokens，全面提升模型的推理能力。

在后训练阶段，提出Test Difficulty Driven Reward策略，缓解困难算法问题中的奖励稀疏问题，引入Easy Data Re-Sampling策略，稳定RL训练。

设计Seamless Rollout系统，加速RL训练和验证，分别提升2.29倍和1.96倍的效率。

在数学推理和代码竞赛公开测评集上，MiMo-7B的性能显著领先于其他同规模模型。