Link:tofu
TOFU資料集包含根據不存在的200位作者虛構生成的問答對,用於評估大型語言模型在真實任務上的遺忘效能。該任務的目標是遺忘在各種遺忘集比例上經過微調的模型。該資料集採用問答格式,非常適合用於流行的聊天模型,如Llama2、Mistral或Qwen。但是,它也適用於任何其他大型語言模型。對應的程式碼庫是針對Llama2聊天和Phi-1.5模型編寫的,但可以輕鬆地適配到其他模型。
需求人群:
"評估語言模型的遺忘能力,訓練可遺忘的聊天機器人模型。"
使用場景示例:
使用TOFU資料集微調Llama模型,然後在不同規模的遺忘集上遺忘模型,評估遺忘效能。
基於TOFU資料集構建聊天機器人,訓練可遺忘的模型,避免機器人記住或洩露敏感資訊。
使用TOFU程式碼庫中的遺忘功能,測試不同模型在遺忘特定資訊時的效能差異。
產品特色:
提供基準遺忘資料集
支援大型語言模型的遺忘效能評估
採用問答格式,適用於聊天機器人模型
程式碼庫支援多種語言模型