Swift:快速AI語音助手

連結:https://github.com/ai-ng/swift

Swift是一個由Groq、Cartesia和Vercel支援的快速AI語音助手。它使用Groq進行OpenAI Whisper和Meta Llama 3的快速推理,Cartesia的Sonic語音模型進行快速語音合成,並實時流式傳輸到前端。VAD技術用於偵測使用者說話並執行語音片段上的回調。Swift是一個使用TypeScript編寫的Next.js專案,並部署在Vercel上。

需求人群:

  • Swift語音助手適合需要快速語音辨識和文本生成的開發者和企業使用者。無論是在構建智慧助手、客服機器人還是其他語音互動應用,Swift都能提供高效、準確的服務。

使用場景示例:

  • 作為智慧家居控制系統的語音接口
  • 整合到客服系統中,提供24/7的自動語音服務
  • 在教育應用中,作為輔助教學的智慧語音助手

產品特色:

  • 使用Groq進行OpenAI Whisper和Meta Llama 3的快速推理
  • Cartesia的Sonic語音模型用於快速語音合成
  • VAD技術偵測使用者說話並執行語音片段上的回調
  • Next.js專案,使用TypeScript編寫
  • 部署在Vercel上,支援快速部署和擴充
  • 支援環境變數配置,易於整合API金鑰
  • 開發伺服器啟動快速,便於開發和測試

使用教學:

克隆Swift的程式碼庫到本地

建立一個包含GROQ_API_KEY和CARTESIA_API_KEY的.env.local檔案

執行pnpm install安裝依賴

執行pnpm dev啟動開發伺服器

訪問開發伺服器地址,體驗Swift語音助手的功能

返回頂端