連結:https://github.com/ai-ng/swift
Swift是一個由Groq、Cartesia和Vercel支援的快速AI語音助手。它使用Groq進行OpenAI Whisper和Meta Llama 3的快速推理,Cartesia的Sonic語音模型進行快速語音合成,並實時流式傳輸到前端。VAD技術用於偵測使用者說話並執行語音片段上的回調。Swift是一個使用TypeScript編寫的Next.js專案,並部署在Vercel上。
需求人群:
- Swift語音助手適合需要快速語音辨識和文本生成的開發者和企業使用者。無論是在構建智慧助手、客服機器人還是其他語音互動應用,Swift都能提供高效、準確的服務。
使用場景示例:
- 作為智慧家居控制系統的語音接口
- 整合到客服系統中,提供24/7的自動語音服務
- 在教育應用中,作為輔助教學的智慧語音助手
產品特色:
- 使用Groq進行OpenAI Whisper和Meta Llama 3的快速推理
- Cartesia的Sonic語音模型用於快速語音合成
- VAD技術偵測使用者說話並執行語音片段上的回調
- Next.js專案,使用TypeScript編寫
- 部署在Vercel上,支援快速部署和擴充
- 支援環境變數配置,易於整合API金鑰
- 開發伺服器啟動快速,便於開發和測試
使用教學:
克隆Swift的程式碼庫到本地
建立一個包含GROQ_API_KEY和CARTESIA_API_KEY的.env.local檔案
執行pnpm install安裝依賴
執行pnpm dev啟動開發伺服器
訪問開發伺服器地址,體驗Swift語音助手的功能