TOFU:TOFU資料集為大型語言模型的虛構遺忘任務提供基準。
TOFU資料集包含根據不存在的200位作者虛構生成的問答對,用於評估大型語言模型在真實任務上的遺忘效能。該任務的目標是遺忘在各種遺忘集比例上經過微調的模型。該資料集採用問答格式,非常適合用於流行的聊天模型,如Llama2、Mistral或Qwen。但是,它也適用於任何其他大型語言模型。對應的程式碼庫是針對Llama2聊天和Phi-1.5模型編寫的,但可以輕鬆地適配到其他模型。
TOFU資料集包含根據不存在的200位作者虛構生成的問答對,用於評估大型語言模型在真實任務上的遺忘效能。該任務的目標是遺忘在各種遺忘集比例上經過微調的模型。該資料集採用問答格式,非常適合用於流行的聊天模型,如Llama2、Mistral或Qwen。但是,它也適用於任何其他大型語言模型。對應的程式碼庫是針對Llama2聊天和Phi-1.5模型編寫的,但可以輕鬆地適配到其他模型。