Dolphin R1 : Dolphin R1是一個用於訓練推理模型的數據集，包含80萬條樣本。

Dolphin R1

AI模型模型訓練與部署 #自然語言處理 #推理模型 #對話系統 #數據集 #AI開發普通產品開源

簡介 :

Dolphin R1是一個由Cognitive Computations團隊創建的數據集，旨在訓練類似DeepSeek-R1 Distill模型的推理模型。該數據集包含30萬條來自DeepSeek-R1的推理樣本、30萬條來自Gemini 2.0 flash thinking的推理樣本以及20萬條Dolphin聊天樣本。這些數據集的組合為研究人員和開發者提供了豐富的訓練資源，有助於提升模型的推理能力和對話能力。該數據集的創建得到了Dria、Chutes、Crusoe Cloud等多家公司的贊助支持，這些贊助商為數據集的開發提供了計算資源和資金支持。Dolphin R1數據集的發佈，為自然語言處理領域的研究和開發提供了重要的基礎，推動了相關技術的發展。

需求人群 :

Dolphin R1數據集適合自然語言處理領域的研究人員和開發者，尤其是那些專注於推理模型訓練和對話系統開發的團隊。該數據集能夠幫助他們提升模型的性能，優化對話交互體驗，並探索新的應用場景。此外，對於學術研究機構和企業來說，Dolphin R1也是一個寶貴的資源，可用於開展前沿研究和開發創新解決方案。

總訪問量： 29.7M

佔比最多地區： US(17.94%)

本站瀏覽量： 66.2K

使用場景

使用Dolphin R1數據集訓練一個推理模型，提升模型在複雜問題上的回答準確率。

結合Dolphin R1數據集開發一個智能客服系統，優化用戶體驗和問題解決效率。

基於Dolphin R1數據集進行學術研究，探索自然語言推理的新方法和新理論。

產品特色

提供高質量的推理樣本，用於訓練和優化模型的推理能力。

包含多樣化的數據來源，涵蓋不同的推理風格和對話場景。

支持大規模模型訓練，滿足不同研究和開發需求。

數據集經過嚴格篩選和清洗，確保數據質量和一致性。