

Mobile Agent
簡介 :
Mobile-Agent是一款自主多模移動設備代理,利用多模大語言模型(MLLM)技術,首先利用視覺感知工具準確識別和定位應用程序前端界面中的視覺和文字元素。基於感知的視覺環境,它自主規劃和分解複雜操作任務,並通過逐步操作來導航移動應用程序。與之前依賴於應用程序的XML文件或移動系統元數據的解決方案不同,Mobile-Agent以視覺為中心的方式在各種移動操作環境中具有更大的適應性,從而消除了對特定系統定製的必要性。為了評估Mobile-Agent的性能,我們引入了Mobile-Eval,這是一個用於評估移動設備操作的基準。基於Mobile-Eval,我們對Mobile-Agent進行了全面評估。實驗結果表明,Mobile-Agent實現了顯著的準確性和完成率。即使在具有挑戰性的指令下,例如多應用程序操作,Mobile-Agent仍然可以完成要求。
需求人群 :
Mobile-Agent可用於自動化移動設備操作,評估移動設備性能,提高移動應用程序的適應性。
使用場景
自動化移動設備操作:Mobile-Agent可用於自動化執行移動應用程序中的任務,提高效率。
移動設備性能評估:利用Mobile-Agent進行移動設備操作評估,以提高性能。
提高移動應用程序適應性:Mobile-Agent可幫助移動應用程序在不同環境中實現更大的適應性。
產品特色
利用多模大語言模型技術
利用視覺感知工具準確識別和定位應用程序前端界面中的視覺和文字元素
自主規劃和分解複雜操作任務
通過逐步操作來導航移動應用程序
具有更大的適應性,消除了對特定系統定製的必要性
引入了Mobile-Eval,用於評估移動設備操作的基準
精選AI產品推薦
中文精選

抖音即創
即創工作臺是一個一站式的智能創意生產與管理平臺。它集成了視頻創作、圖文創作、直播創作等多種創意工具,可以通過AI的力量大大提高創作效率。主要功能和優勢包括:1)視頻創作:內置多種AI視頻創作工具,支持智能編劇、數字人物、一鍵成片等,可快速生成高質量視頻內容;2)圖文創作:提供智能圖文和商品圖片生成工具,可快速製作微信文章、產品詳情等圖文內容;3)直播創作:支持AI直播背景、直播文案等創作工具,可輕鬆製作抖音、快手等直播內容。定位為新創和創意從業者的創意助手,以合理價格提供創意生產全流程服務。
AI設計工具
106.5M

神采 PromeAI
神采 PromeAI 擁有強大的人工智能驅動設計助手和廣泛可控的 AIGC(C-AIGC)模型風格庫,使你能夠輕鬆地創造出令人驚歎的圖形、視頻和動畫,是建築師、室內設計師、產品設計師和遊戲動漫設計師的必備工具。
AI設計工具
8.4M