LMSYS Chatbot Arena Leaderboard:大型語言模型 (LLM) 效能評測的眾包開放平臺

LMSys 聊天機器人競技場排行榜是一個用於評估大型語言模型 (LLM) 效能的眾包開放平臺。它利用 Elo 排名系統對 LLM 進行排名,排名依據是超過 30 萬使用者投票的結果。使用者可以在網站上與不同的 LLM 進行互動,並根據其對話質量進行投票。該排行榜可用於追蹤不同 LLM 的發展趨勢,併為研究人員和開發者提供基準測試工具。