音訊生成

GenAU：音訊生成與自動字幕生成模型

自動字幕, 音訊生成

GenAU是一個由Snap Research開發的音訊生成模型，它透過AutoCap自動字幕生成模型和GenAu音訊生成架構，顯著提升了音訊生成的質量。它在生成環境聲音和效果方面具有挑戰性，特別是在資料稀缺和字幕質量不足的情況下。GenAU模型能夠生成高質量的音訊，並且在音訊合成領網域具有很大的潛力。

Resona V2A：智慧影片到音訊生成，簡化聲音設計

自動化, 音訊生成

Resona V2A是一款AI驅動的影片到音訊生成技術產品，它能夠僅透過影片資料自動生成與場景、動畫或電影完美匹配的聲音設計、效果、擬音和環境音。該技術透過自動化音訊創作過程，節省了大約90%的時間和努力，使得音訊製作更加高效和智慧。

Stable Audio Open：開源音訊樣本和聲音設計模型

開源模型, 音訊生成

Stable Audio Open是一個開源的文本到音訊模型，專為生成短音訊樣本、音效和製作元素而最佳化。它允許使用者透過簡單的文本提示生成高達47秒的高質量音訊資料，特別適用於創造鼓點、樂器即興演奏、環境聲音、擬音錄音等音樂製作和聲音設計。

OptimizerAI：OptimizerAI是一個AI聲音效果生成器，為創作者、遊戲開發者、藝術家和影片製作者提供服務

AI聲音效果, 音訊生成

OptimizerAI專注於使用人工智慧技術生成各種聲音效果，旨在為遊戲、影片、短片、廣告等多媒體內容增添活力。該平臺提供了高質量的音訊生成服務，並計劃推出文字到聲音效果生成功能。