Link:https://blog.research.google/2024/01/introducing-aspire-for-selective.html
ASPIRE是一個設計精良的框架,用於增強大型語言模型的選擇性預測能力。它透過引數高效的微調訓練LLM進行自我評估,使其能夠針對生成的答案輸出置信度分數。實驗結果表明,ASPIRE在各種問答資料集上明顯優於目前的選擇性預測方法。
需求人群:
[“提高問答系統的可靠性”,”減少語言模型在關鍵決策中的不確定性”]
使用場景示例:
ASPIRE可以增強聊天機器人判斷自己回答是否正確的能力。
ASPIRE讓語言模型有信心只在確定答案時進行回答,減少錯誤預測。
ASPIRE提高了問答模型判斷答案准確率的能力。
產品特色:
進行任務特定調參改進模型效能
生成可能的候選答案
學習自我評估以區分正確與錯誤的答案