Link:instructvideo
InstructVideo 是一種透過人類反饋用獎勵微調來指導文字到影片的擴散模型的方法。它透過編輯的方式進行獎勵微調,減少了微調成本,同時提高了微調效率。它使用已建立的影象獎勵模型,透過分段稀疏取樣和時間衰減獎勵的方式提供獎勵訊號,顯著提高了生成影片的視覺質量。InstructVideo 不僅能夠提高生成影片的視覺質量,還能保持較強的泛化能力。欲瞭解更多資訊,請訪問官方網站。
需求人群:
"適用於指導文字到影片生成模型的訓練和最佳化"
產品特色:
透過人類反饋進行獎勵微調
編輯方式進行獎勵微調
使用影象獎勵模型提供獎勵訊號
分段稀疏取樣和時間衰減獎勵