

Webvoyager
簡介 :
WebVoyager是一款創新的大型多模態模型(LMM)驅動的網絡代理,能夠通過與現實世界的網站交互,端到端完成用戶指令。我們提出了一種新的網絡代理評估協議,以解決開放式網絡代理任務的自動評估挑戰,利用GPT-4V的強大多模態理解能力。我們從15個廣泛使用的網站收集了真實世界任務,用於評估我們的代理。我們展示了WebVoyager實現了55.7%的任務成功率,明顯超過了GPT-4(所有工具)和WebVoyager(僅文本)設置的性能,突顯了WebVoyager在實際應用中的卓越能力。我們發現我們提出的自動評估與人類判斷達成了85.3%的一致性,為在真實世界環境中進一步發展網絡代理鋪平了道路。
需求人群 :
WebVoyager可用於自動執行真實世界網站任務,適用於需要大規模信息處理和交互的場景。
使用場景
自動化網頁內容更新
即時網站交互
網站任務自動執行
產品特色
端到端完成用戶指令
與現實世界的網站交互
具有強大的多模態理解能力
精選AI產品推薦

Openui
構建UI組件通常是一項乏味的工作。OpenUI旨在使這一過程變得有趣、快捷和靈活。這也是我們在W&B用於測試和原型化下一代工具的工具,用於在LLM的基礎上構建強大的應用程序。您可以使用想象力描述UI,然後即時查看渲染效果。您可以要求進行更改,並將HTML轉換為React、Svelte、Web組件等。就像是V0的開源和不太精緻的版本。
AI開發助手
786.0K

Opendevin
OpenDevin是一個開源項目,目標是複製、增強和創新Devin——一個能夠執行復雜工程任務並與用戶在軟件開發項目上積極協作的自主AI軟件工程師。該項目通過開源社區的力量,探索和擴展Devin的能力,識別其優勢和改進空間,以指導開源代碼模型的進展。
AI開發助手
615.2K