Unstract:無程式碼LLM平臺,用於結構化非結構化文檔

連結:https://unstract.com

Unstract是一個無程式碼的LLM(大型語言模型)平臺,它允許使用者透過簡單的無程式碼方法啟動APIs和ETL管道來處理非結構化文檔。它支援從多種雲檔案/對象儲存系統中讀取複雜文檔,並將結構化資料寫入流行的資料倉儲和資料庫。Unstract利用大型語言模型的能力,超越了傳統的RPA(機器人流程自動化),實作了機器到機器的自動化。

需求人群:

  • Unstract的目標受眾是希望自動化處理複雜文檔的企業和開發者。它適合那些需要將非結構化資料轉換為結構化資料以便於分析和儲存的使用者。Unstract透過簡化API和ETL管道的部署過程,使得沒有程式設計背景的使用者也能輕鬆實作自動化。

使用場景示例:

  • 企業使用Unstract自動化處理客戶反饋表單,提取關鍵資訊並儲存到資料庫。
  • 資料分析師使用Unstract從PDF報告中提取資料,進行市場分析。
  • 開發團隊使用Unstract快速構建API,將非結構化日誌資料轉換為可用於機器學習的結構化格式。

產品特色:

  • 使用無程式碼Prompt Studio新增文檔並進行提示工程來提取所需欄位。
  • 將Prompt Studio專案配置為API部署或配置ETL管道的輸入源和輸出目的地。
  • 部署工作流作為非結構化資料APIs或非結構化資料ETL管道。
  • 支援多種LLM提供商,如OpenAI、Google VertexAI、Azure OpenAI等。
  • 支援多種向量資料庫和嵌入模型,如Qdrant、Weaviate、OpenAI等。
  • 支援多種ETL源和目的地,如AWS S3、Minio、Snowflake、Amazon Redshift等。
  • 提供詳細的文檔和快速入門指南,幫助使用者快速上手。

使用教學:

訪問Unstract的GitHub頁面並克隆或下載專案。

確保系統滿足執行要求,包括Linux或MacOS、Docker、Docker Compose、Git等。

執行`./run-platform.sh`腳本啟動Unstract平臺。

在瀏覽器中訪問http://frontend.unstract.localhost並使用預設使用者名稱和密碼登入。

透過Quick Start Guide學習如何使用Prompt Studio和部署API。

根據需要配置ETL管道,連線資料來源和目的地。

部署工作流並開始自動化處理非結構化文檔。

返回頂端