

Project Mariner
簡介 :
Project Mariner是Google DeepMind基於Gemini 2.0模型開發的早期研究原型,旨在探索未來的人機交互方式,特別是在網絡瀏覽器中的應用。這個項目能夠理解瀏覽器屏幕上的信息,包括像素和網頁元素,如文本、代碼、圖像和表單,並利用這些信息完成任務。Project Mariner在技術上實現了通過Chrome擴展程序在瀏覽器中直接操作,為用戶提供了一種全新的代理服務體驗。
需求人群 :
Project Mariner的目標受眾是技術愛好者和早期採用者,特別是那些對AI代理技術和未來人機交互方式感興趣的用戶。這個項目適合希望在瀏覽器環境中提高效率、簡化複雜任務的用戶,同時也適合開發者和研究人員,他們可以基於這個項目進行進一步的研究和開發。
使用場景
用戶在使用Project Mariner時,可以直接通過代理完成網上購物、信息查詢等任務,而無需手動操作。
開發者可以利用Project Mariner的API,將其集成到自己的應用中,為用戶提供更加智能的網絡服務。
研究人員可以通過Project Mariner收集的數據,分析用戶行為和偏好,以改進產品設計。
產品特色
理解網頁信息:能夠理解瀏覽器屏幕上的信息,包括文本、代碼、圖像和表單等元素。
任務執行:使用實驗性的Chrome擴展程序,根據用戶指令完成瀏覽器中的任務。
性能評估:在WebVoyager基準測試中,Project Mariner達到了83.5%的完成率,展現了其在實際網絡任務中的性能。
安全交互:在執行敏感操作前請求用戶最終確認,以防止潛在的欺詐和釣魚嘗試。
持續學習:通過與網絡生態系統的互動,不斷學習和改進,以提高準確性和效率。
使用教程
步驟1:安裝並設置實驗性的Chrome擴展程序,以便與Project Mariner交互。
步驟2:在瀏覽器中打開需要自動化任務的網頁。
步驟3:通過擴展程序向Project Mariner發出指令,讓其理解當前頁面內容。
步驟4:Project Mariner根據用戶的指令,在瀏覽器中執行相應的任務,如填寫表單、搜索信息等。
步驟5:在執行敏感操作前,Project Mariner會請求用戶確認,確保操作的安全性。
步驟6:監控Project Mariner的執行過程,確保任務按照預期完成。
步驟7:根據執行結果提供反饋,幫助改進Project Mariner的性能和用戶體驗。