4M:多模態和多工模型訓練框架

4M是一個用於訓練多模態和多工模型的框架,能夠處理多種視覺任務,並且能夠進行多模態條件生成。該模型透過實驗分析展示了其在視覺任務上的通用性和可擴充性,為多模態學習在視覺和其他領網域的進一步探索奠定了基礎。