音訊處理

Omniverse Audio2Face:透過生成式人工智慧,從音訊源輕鬆建立表情豐富的面部動畫。

NVIDIA Omniverse™ Audio2Face beta是一個用於將3D角色面部特徵動畫化以匹配任何配音軌的基礎應用程式,無論是用於遊戲、電影、實時數字助手,還是僅僅為了娛樂。您可以將這個基於通用場景描述(OpenUSD)的應用程式用於互動式實時應用程式或作為傳統的面部動畫創作工具。您可以實時執行結果,也可以將其烘焙出來,這取決於您。

Hanami Live Translator:實時翻譯器,捕捉來自WINDOWS揚聲器和麥克風的任何音訊

Hanami Live Translator是一個實時翻譯器,可以捕捉來自WINDOWS揚聲器和麥克風的任何音訊。它使用輕量級多進程和分塊處理音訊,每個塊處理時間約為3-5秒。該應用程式透過低階訪問建立硬體迴環,即使揚聲器靜音,也可以監聽內容。它使用soundcard庫捕獲音訊訊號,SpeechRecognition庫將二進位制音訊轉換為文字,selenium庫模擬deepl伺服器的網路呼叫進行免費翻譯。該應用程式需要與網際網路連線才能執行,並透過Traces.log檔案記錄所有操作。

返回頂端