Agent-E:基於代理的自動化系統,專注於網頁自動化

連結:https://github.com/EmergenceAI/Agent-E

Agent-E 是一個基於 AutoGen 代理框架的系統,旨在自動化使用者電腦上的操作,目前專注於瀏覽器內的自動化。它透過自然語言與網頁瀏覽器互動,執行填寫表單、搜尋和排序電商產品、定位網站內容、管理播放設定、執行網路搜尋、管理專案管理平臺任務等操作。Agent-E 正在成長中,已經能夠處理多樣化的任務,但最佳任務是使用者自行發掘的。

需求人群:

  • Agent-E 適合需要自動化網頁任務的開發者和普通使用者,無論是在資料輸入、產品搜尋、內容定位還是日常的網頁瀏覽和管理中,都能提供高效的解決方案。

使用場景示例:

  • 在 YouTube 上搜尋並播放 Veritasium 的 Oppenheimer 影片。
  • 使用電子郵件中的文本作為指令,自動填寫表單並等待使用者稽核提交。
  • 在亞馬遜上搜尋 Finish 洗碗機洗滌片,按暢銷排序並將其新增到購物車。
  • 驗證 Twitter 上關於免費課程的資訊,並導覽到 NVIDIA 開發者頁面確認課程的可用性。

產品特色:

  • 填寫表單:使用使用者資訊或來自其他網站的資訊自動填寫網路表單。
  • 電商產品搜尋與排序:在電商網站如亞馬遜上根據暢銷或價格等標準搜尋和排序產品。
  • 網站內容定位:在網站如 ESPN 上查詢體育比分或在大學頁面上查詢聯絡資訊。
  • 網路媒體互動:播放 YouTube 影片和管理播放設定,如全屏和靜音。
  • 綜合網路搜尋:在廣泛的主題上執行網路搜尋,從歷史地點到頂級本地餐廳。
  • 專案管理自動化:在專案管理平臺(如 JIRA)上透過過濾問題來簡化工作流程。
  • 個人購物助手:根據使用者需求推薦產品,如遊戲卡的儲存選項。

使用教學:

安裝必要的軟體和依賴,如 uv 和 playwright。

建立並啟用虛擬環境,生成 requirements.txt 檔案並安裝依賴。

配置 .env 檔案,設定 AUTOGEN_MODEL_NAME 和 AUTOGEN_MODEL_API_KEY 等環境變數。

執行 Agent-E 程式,瀏覽器上會出現圖示,點選後展開聊天式介面。

在聊天介面中輸入自然語言請求,如 ‘打開 YouTube’ 或 ‘在亞馬遜上找到 Nothing Phone 2 並按暢銷排序’。

根據 Agent-E 的反饋進行操作,如稽核表單填寫內容或確認影片播放。

返回頂端