RAGElo:RAG-based LLM agents的Elo排名工具

RAGElo是一個工具集,使用Elo評分系統幫助選擇最佳的基於檢索增強生成(RAG)的大型語言模型(LLM)代理。隨著生成性LLM在生產中的原型設計和整合變得更加容易,評估仍然是解決方案中最具有挑戰性的部分。RAGElo透過比較不同RAG管道和提示對多個問題的答案,計算不同設定的排名,提供了一個良好的概覽,瞭解哪些設定有效,哪些無效。