

Xiaomi MiMo
簡介 :
Xiaomi MiMo是小米公司開源的首個推理大模型,專為推理任務設計,具備卓越的數學推理和代碼生成能力。該模型在數學推理(AIME 24-25)和代碼競賽(LiveCodeBench v5)公開測評集上表現出色,僅用7B的參數規模就超越了OpenAI的o1-mini和阿里Qwen的QwQ-32B-Preview等更大規模的模型。MiMo通過預訓練和後訓練階段的多層面創新,包括數據挖掘、訓練策略和強化學習算法等,顯著提升了推理能力。該模型的開源為研究人員和開發者提供了強大的工具,推動了人工智能在推理領域的進一步發展。
需求人群 :
Xiaomi MiMo適合需要高效推理能力的研究人員、開發者和企業。其強大的數學推理和代碼生成能力使其在學術研究、軟件開發、數據分析和教育等領域具有廣泛的應用前景。對於研究人員來說,MiMo提供了強大的推理工具,有助於推動人工智能在推理領域的研究。對於開發者而言,MiMo可以集成到各種應用中,提升應用的智能水平。對於企業來說,MiMo可以用於優化業務流程,提高決策效率。
使用場景
研究人員可以使用MiMo進行復雜的數學推理研究,提升模型在數學問題上的表現。
開發者可以將MiMo集成到代碼編輯器中,為程序員提供即時代碼建議和優化方案。
企業可以利用MiMo的推理能力優化業務流程,例如在金融領域進行風險評估和預測。
產品特色
預訓練階段,著重挖掘富推理語料,合成約200B tokens推理數據,確保模型見過更多推理模式。
進行三階段訓練,逐步提升訓練難度,總訓練量達到25T tokens,全面提升模型的推理能力。
在後訓練階段,提出Test Difficulty Driven Reward策略,緩解困難算法問題中的獎勵稀疏問題,引入Easy Data Re-Sampling策略,穩定RL訓練。
設計Seamless Rollout系統,加速RL訓練和驗證,分別提升2.29倍和1.96倍的效率。
在數學推理和代碼競賽公開測評集上,MiMo-7B的性能顯著領先於其他同規模模型。
MiMo-7B全系列已開源,提供4個模型至HuggingFace,方便研究人員和開發者使用。
技術細節已在GitHub公開,包括完整的訓練報告和技術文檔,方便社區交流和進一步研究。
MiMo模型由小米大模型Core團隊開發,展示了小米在人工智能領域的創新能力和技術實力。
使用教程
訪問HuggingFace上的MiMo模型頁面:
下載並安裝所需的MiMo模型版本。
使用HuggingFace提供的API或工具加載模型,並進行推理任務。
根據需要對模型進行微調,以適應特定的推理任務或數據集。
利用MiMo的技術報告和文檔,深入瞭解模型的訓練細節和使用技巧。
精選AI產品推薦

Deepmind Gemini
Gemini是谷歌DeepMind推出的新一代人工智能系統。它能夠進行多模態推理,支持文本、圖像、視頻、音頻和代碼之間的無縫交互。Gemini在語言理解、推理、數學、編程等多個領域都超越了之前的狀態,成為迄今為止最強大的AI系統之一。它有三個不同規模的版本,可滿足從邊緣計算到雲計算的各種需求。Gemini可以廣泛應用於創意設計、寫作輔助、問題解答、代碼生成等領域。
AI模型
11.4M
中文精選

Liblibai
LiblibAI是一箇中國領先的AI創作平臺,提供強大的AI創作能力,幫助創作者實現創意。平臺提供海量免費AI創作模型,用戶可以搜索使用模型進行圖像、文字、音頻等創作。平臺還支持用戶訓練自己的AI模型。平臺定位於廣大創作者用戶,致力於創造條件普惠,服務創意產業,讓每個人都享有創作的樂趣。
AI模型
8.0M