

LMSYS Chatbot Arena
簡介 :
LMSYS Chatbot Arena 是一個在線平臺,旨在通過用戶與匿名聊天機器人模型的互動,對大型語言模型(Large Language Models, LLMs)進行基準測試。該平臺收集了超過70萬次人類投票,計算出LLM的Elo排行榜,以確定誰是聊天機器人領域的冠軍。平臺提供了一個研究預覽,具有有限的安全措施,可能生成不當內容,因此需要用戶遵守特定的使用條款。
需求人群 :
["研究人員和開發者:可以利用該平臺測試和比較不同語言模型的性能。","普通用戶:可以體驗並瞭解當前語言模型的對話能力。","教育者:可以用作教學工具,展示語言模型在實際對話中的應用。"]
使用場景
研究人員使用LMSYS Chatbot Arena來評估不同模型在特定任務上的表現。
普通用戶通過該平臺瞭解不同聊天機器人的個性和回答風格。
教育者在課堂上展示如何使用LMSYS Chatbot Arena來比較語言模型。
產品特色
匿名與兩個聊天機器人模型進行對話
用戶可以對兩個模型的回答進行投票,選擇更好的一個
繼續對話直到用戶識別出勝者
如果模型身份在對話中被揭露,投票將不被計數
查看並比較41個不同模型的描述
分享對話結果
重新生成對話以進行新的比較
使用教程
訪問LMSYS Chatbot Arena的網站
選擇兩個匿名模型進行對話
提出問題並觀察兩個模型的回答
對兩個模型的回答進行投票,選擇你認為更好的回答
可以繼續對話直到你決定一個勝者,或者使用'New Round'開始新的比較
如果需要,可以使用'Regenerate'重新生成對話