TOFU:TOFU資料集為大型語言模型的虛構遺忘任務提供基準。

Link:tofu
TOFU資料集包含根據不存在的200位作者虛構生成的問答對,用於評估大型語言模型在真實任務上的遺忘效能。該任務的目標是遺忘在各種遺忘集比例上經過微調的模型。該資料集採用問答格式,非常適合用於流行的聊天模型,如Llama2、Mistral或Qwen。但是,它也適用於任何其他大型語言模型。對應的程式碼庫是針對Llama2聊天和Phi-1.5模型編寫的,但可以輕鬆地適配到其他模型。

需求人群:

"評估語言模型的遺忘能力,訓練可遺忘的聊天機器人模型。"

使用場景示例:

使用TOFU資料集微調Llama模型,然後在不同規模的遺忘集上遺忘模型,評估遺忘效能。

基於TOFU資料集構建聊天機器人,訓練可遺忘的模型,避免機器人記住或洩露敏感資訊。

使用TOFU程式碼庫中的遺忘功能,測試不同模型在遺忘特定資訊時的效能差異。

產品特色:

提供基準遺忘資料集

支援大型語言模型的遺忘效能評估

採用問答格式,適用於聊天機器人模型

程式碼庫支援多種語言模型

返回頂端