模型評估 Archives - AI書籤-全球ai人工智慧產品和服務

FiddleCube：快速生成問答資料，評估語言模型

FiddleCube是一個專注於資料科學領網域的產品，它能夠快速地從使用者的資料中生成問答對，幫助使用者評估大型語言模型（LLMs）。它提供了準確的黃金資料集，支援多種問題型別，並能夠透過度量標準來評估資料的準確性。此外，FiddleCube還提供了診斷工具，幫助使用者找出並改進效能不佳的查詢。

Vision Arena：Vision Arena是一個面向計算機視覺領域的開源模型測試平臺

模型評估, 計算機視覺

Vision Arena是一個由Hugging Face建立的開源平臺,用於測試和比較不同的計算機視覺模型效果。它提供了一個友好的介面,允許使用者上傳圖片並透過不同模型處理,從而直觀地對比結果質量。平臺預裝了主流的影象分類、對象檢測、語義分割等模型,也支援自定義模型。關鍵優勢是開源免費,使用簡單,支援多模型並行測試,有利於模型效果評估和選擇。適用於計算機視覺研發人員、演演算法工程師等角色,可以加速計算機視覺模型的實驗和調優。