WebLlama:構建能夠根據指令瀏覽網頁並和您對話的強大代理

WebLlama
Link:webllama
WebLlama是一個基於Meta Llama 3構建的代理,專門為網頁導覽和對話進行了微調。它旨在構建有效的以人為中心的代理,幫助使用者瀏覽網頁,而不是取代使用者。該模型在WebLINX基準測試中超越了GPT-4V(零樣本)18%,展示了其在網頁導覽任務中的卓越效能。

需求人群:

["研究人員和開發者:可以利用WebLlama進行網頁導覽任務的研究和開發","企業使用者:透過WebLlama進行自動化的網頁互動,提高工作效率","技術愛好者:探索和學習最新的網頁導覽和對話代理技術"]

使用場景示例:

使用WebLlama自動化完成網上預訂流程

整合到現有系統中,實作複雜的網頁資料抓取任務

作為研究工具,探索網頁導覽和對話系統的新方法

產品特色:

使用Meta Llama 3進行網頁導覽任務的訓練

在WebLINX資料集上進行微調,包含超過24K實例的網頁互動

提供訓練腳本、最佳化配置和訓練尖端Llamas的指導

整合現有的部署平臺,如Playwright、Selenium和BrowserGym

在Hugging Face Model Hub上提供模型和訓練評估資料

在150個網站的基礎上進行訓練和評估,覆蓋多種複雜任務

返回頂端