PAB:實時影片生成技術
PAB 是一種用於實時影片生成的技術,透過 Pyramid Attention Broadcast 實作影片生成過程的加速,提供了高效的影片生成解決方案。該技術的主要優點包括實時性、高效性和質量保障。PAB 適用於需要實時影片生成能力的應用場景,為影片生成領網域帶來了重大突破。
PAB 是一種用於實時影片生成的技術,透過 Pyramid Attention Broadcast 實作影片生成過程的加速,提供了高效的影片生成解決方案。該技術的主要優點包括實時性、高效性和質量保障。PAB 適用於需要實時影片生成能力的應用場景,為影片生成領網域帶來了重大突破。
LookOnceToHear 是一種創新的智慧耳機互動系統,允許使用者透過簡單的視覺辨識來選擇想要聽到的目標說話者。這項技術在 CHI 2024 上獲得了最佳論文榮譽提名。它透過合成音訊混合、頭相關傳輸函式(HRTFs)和雙耳房間脈衝響應(BRIRs)來實作實時語音提取,為使用者提供了一種新穎的互動方式。