AI產品&服務

Hanami Live Translator:實時翻譯器,捕捉來自WINDOWS揚聲器和麥克風的任何音訊

Hanami Live Translator是一個實時翻譯器,可以捕捉來自WINDOWS揚聲器和麥克風的任何音訊。它使用輕量級多進程和分塊處理音訊,每個塊處理時間約為3-5秒。該應用程式透過低階訪問建立硬體迴環,即使揚聲器靜音,也可以監聽內容。它使用soundcard庫捕獲音訊訊號,SpeechRecognition庫將二進位制音訊轉換為文字,selenium庫模擬deepl伺服器的網路呼叫進行免費翻譯。該應用程式需要與網際網路連線才能執行,並透過Traces.log檔案記錄所有操作。

AudioSep:基於自然語言查詢的開放領域音訊源分離模型

AudioSep是一種基於自然語言查詢的開放領域音訊源分離模型。它由文字編碼器和分離模型兩個關鍵元件組成。我們在大規模多模態資料集上訓練AudioSep,並在許多工上廣泛評估其能力,包括音訊事件分離、樂器分離和語音增強。AudioSep表現出強大的分離效能和令人印象深刻的零樣本泛化能力,使用音訊標題或文字標籤作為查詢,大大優於以前的音訊查詢和語言查詢聲音分離模型。為了保證本工作的可重複性,我們將釋出原始碼、評估基準和預訓練模型。

Kits AI:AI 聲音生成與訓練工具包

Kits AI 是一個 AI 聲音生成和免費 AI 聲音訓練平臺,讓音樂人使用和建立 AI 聲音。您可以使用 Kits.AI 來改變您的聲音,使用我們的官方授權或免費聲音庫中的 AI 藝術家聲音,也可以從頭開始建立、訓練和分享您自己的 AI 聲音。主要功能包括 AI 聲音轉換、AI 聲音克隆、文字轉語音、聲音分離等。Kits AI 與藝術家和創作者直接合作,以正式授權他們的 AI 聲音模型。定價請訪問官網獲取詳細資訊。

VisualElectric:以創意為導向的人工智慧影象生成平臺

Visual Electric是一個面向創意人員的影象生成平臺,能夠促進創意思維流程,幫助使用者將心中的視覺點子變為現實。該平臺採用富有創造力的介面設計,提供開放式畫布,激發靈感,便於開展視覺概唸的創作。平臺鼓勵透過“重混”功能進行迭代開發,讓使用者透過不同的氛圍和顏色不斷完善創意。這種靈活性讓創作者可以探索廣泛的風格和迭代版本,直到他們的創意完美呈現。

Shakker:Shakker是一款領先的AI影象生成工具

Shakker是一個基於人工智慧的影象生成平臺,它可以透過文字描述生成高質量的影象。該平臺採用了最先進的深度學習技術,使用者只需輸入幾句文字描述,就可以生成逼真的圖片。Shakker的核心優勢在於生成影象質量高,支援中文描述,操作簡單易用。它覆蓋了從藝術創作、商業設計到娛樂等多個領域,有效地提高了使用者的工作效率。

千變萬換:保留圖中任意一個或多個物體,對其他區域進行生成。

千變萬換是一款影象處理工具,可以保留圖中任意一個或多個物體(包括人,衣服,商品,背景等),對其他區域進行生成。使用者可以透過上傳圖片並指定要保留的物體,然後選擇生成的方式,可以是隨機生成的背景,也可以是使用者自定義的背景。該工具可以幫助使用者快速生成各種創意影象,適用於廣告設計、藝術創作等領域。千變萬換採用先進的影象處理技術,生成的效果真實自然。該工具為線上使用,無需下載安裝,操作簡便,適用於不同的使用者群體。

AI Up House:將您的願景轉化為令人驚歎的人工智慧影象

AI Up House是一個由人工智慧愛好者建立的網站,旨在分享與上升房屋和其他主題相關的美麗圖片。該網站不僅僅是分享上升房屋的圖片;它還會分享許多其他型別的美麗圖片,如風景、動物、人物、建築等。這些圖片由人工智慧生成,具有高度的逼真性和創造力,為您提供視覺享受和靈感。您可以隨時隨地使用這些圖片,無論是作為壁紙、頭像、海報、卡片,或者任何其他用途,只要您喜歡。

返回頂端