AI書籤-全球ai人工智慧產品和服務

大餅AI變聲：實時變聲，讓聲音更好聽

大餅AI變聲是一款全鏈解決方案，支援Win/Mac/iOS/Android版本可選，提供SDK及高DAU使用。除了實時變聲，還為聲音從業者打造了音色轉換工具，為內容創作者提供了文字轉語音等功能。

Sound Effects：生成無限制的免費音效

OptimizerAI是一個使用人工智慧生成音效的工具。它提供了無限制的免費音效，適用於遊戲製作、影片製作、內容創作等各種場景。使用者可以根據需求生成各種完美的免版稅音效。OptimizerAI採用最先進的技術，生成的音效質量高，支援44.1kHz立體聲高品質音訊。未來還將推出文字轉音效和影片轉音效功能。

Diffusion Priors：動態視角合成的擴散先驗模型

動態場景, 視角合成

本論文提出了一種基於擴散先驗的動態視角合成方法，用於從單目影片中生成動態場景的新視角。該方法透過對影片幀進行微調和知識蒸餾，實現了幾何一致性和場景一致性。論文透過定性和定量實驗評估了方法的有效性和魯棒性，證明了該方法在複雜場景下的優勢。

WonderJourney：從任何地方到任何地方的盡探索

場景生成, 奇妙之旅

WonderJourney 是一個模組化的場景生成框架，透過使用者提供的位置資訊，可以生成一系列多樣且相互連貫的 3D 場景，形成想象中的 “奇妙之旅”。透過利用語言模型生成場景的文字描述，使用文字驅動的點雲生成流程生成連貫的 3D 場景，透過大規模驗證模型對生成的場景進行驗證。WonderJourney 展示了多樣的視覺效果，包括各種型別和風格的場景。

QuickVision：快速截圖分享和自定義提示的ChatGPT視覺外掛

截圖分享

QuickVision是為ChatGPT Plus使用者設計的Chrome外掛，可實現ChatGPT視覺功能。它可以快速截圖分享，並允許自定義提示，提升與AI的互動體驗。功能包括：快速截圖分享、實用的自定義提示、自動整合到ChatGPT介面、不需要額外的代幣費用。使用場景包括：AI聊天、影象討論、個性化對話等。

TOFU：TOFU資料集為大型語言模型的虛構遺忘任務提供基準。

語言模型, 遺忘

TOFU資料集包含根據不存在的200位作者虛構生成的問答對,用於評估大型語言模型在真實任務上的遺忘效能。該任務的目標是遺忘在各種遺忘集比例上經過微調的模型。該資料集採用問答格式,非常適合用於流行的聊天模型,如Llama2、Mistral或Qwen。但是,它也適用於任何其他大型語言模型。對應的程式碼庫是針對Llama2聊天和Phi-1.5模型編寫的,但可以輕鬆地適配到其他模型。

Diffusion with Forward Models：解決隨機逆問題，無需直接監督

去噪擴散模型

該產品是一種新型去噪擴散機率模型，學習從未直接觀察到的訊號分佈中取樣，而是透過已知的可微分前向模型測量。該產品可直接從部分觀測的未知訊號分佈中取樣，適用於計算機視覺任務。在逆圖形學中，它能夠生成與單個2D輸入影象一致的3D場景分佈。產品定價靈活，定位於影象處理和計算機視覺領域。

SimplifiedETF：初學者友好的ETF投資

ETF投資, 初學者友好

SimplifiedETF是為初學者提供的智慧、安全的ETF投資平臺。我們透過個性化的策略和易於理解的財務指導，引導新投資者安全、輕鬆地增長財富。

Kreo Software：AI施工測量與成本估算軟體

施工測量

Kreo是一款功能強大的AI施工測量與成本估算軟體。它可以準確測量PDF和CAD檔案，進行數量測算和估算。Kreo具有直觀的介面和AI功能，可以簡化施工流程，增強協作，使專業人員能夠建立準確的測量和估算。Kreo適用於建築公司、工程測量師、成本估算師和承包商等不同型別的施工公司。

LucidDreamer：單文字/影象生成可導航3D場景

3D場景生成, 可導航

LucidDreamer是一種無域3D場景生成技術，透過充分利用現有大規模擴散生成模型的能力，可以從單個文字提示或單個影象生成可導航的3D場景。該方法具有夢境和對齊兩個交替步驟，首先根據輸入生成多視角一致的影象，然後將新生成的3D場景部分和諧地整合在一起。LucidDreamer生成的高度詳細的高斯斑點與以往的3D場景生成方法相比沒有目標場景域的限制。