ASPIRE:增強大型語言模型的選擇性預測能力框架

Link:https://blog.research.google/2024/01/introducing-aspire-for-selective.html

ASPIRE是一個設計精良的框架,用於增強大型語言模型的選擇性預測能力。它透過引數高效的微調訓練LLM進行自我評估,使其能夠針對生成的答案輸出置信度分數。實驗結果表明,ASPIRE在各種問答資料集上明顯優於目前的選擇性預測方法。

需求人群:

[“提高問答系統的可靠性”,”減少語言模型在關鍵決策中的不確定性”]

使用場景示例:

ASPIRE可以增強聊天機器人判斷自己回答是否正確的能力。

ASPIRE讓語言模型有信心只在確定答案時進行回答,減少錯誤預測。

ASPIRE提高了問答模型判斷答案准確率的能力。

產品特色:

進行任務特定調參改進模型效能

生成可能的候選答案

學習自我評估以區分正確與錯誤的答案

返回頂端