正在加载视频...
视频加载失败
阿里刚刚放出了其GUI Agent第三代框架:Mobile-Agent-v3,在10+GUI基准测试中取得了SOTA性能 在AndroidWorld上达到73.3,在OSWorld上达到37.7 Mobile-Agent-v3是一款基于GUI-Owl的跨平台多智能体框架,GUI-Owl也同时被开源,这是一款多模态跨平台GUI虚拟层模型 GUI-Owl作为GUI自动化基础模型,具备GUI感知、落地、端到端操作能力 可以理解GUI界面布局、元素,把指令转化为具体的屏幕坐标和操作,完成完整的GUI操作流程 Mobile-Agent-v3利用GUI-Owl能力与GUI交互,具备任务分解、规划以及进度管理、异常处理和反射能力、关键信息记录能力 比如,完成特定目标制定行动计划,跟踪任务执行进度,反馈调整行动。具备关键信息记录能力,支持跨应用任务 #MobileAgentv3 #GUIAgent #AIagent
16,734 次观看 • 9 个月前 •via X (Twitter)
0 条评论
暂无评论
原始帖子的评论将显示在这里
