近日,西安交通大学智能网络与网络安全教育部重点实验室团队研发了一项基于视觉的移动设备任务自动化方案——VisionTasker。该方案利用AI技术精准捕捉并解析用户意图,实现移动设备上多样化的任务自动化,为视障人群、老年人及驾驶员等提供便利。VisionTasker通过视觉理解用户界面,并结合大语言模型进行任务规划与执行,显著提升了界面适应性和任务完成效率。实验结果显示,VisionTasker在处理复杂用户界面和多步骤任务时,表现优于传统方法,甚至在某些情况下超过人类。该研究成果已在近期的人机交互顶级会议UIST上发表,标志着移动任务自动化领域的重大突破。 发布时间:2024年10月13-16日。
原文链接
本文链接:https://kx.umi6.com/article/8144.html
转载请注明文章出处
相关推荐
.png)
换一换
欧盟发布通用人工智能模型提供商指南
2025-07-18 21:46:03
雷军黄仁勋12年后再同框
2025-07-21 10:14:19
因被 AI 生成的虚假漏洞报告轰炸,开源网络工具 cURL 考虑停止提供安全赏金
2025-07-19 21:57:13
421 文章
64867 浏览
24小时热文
更多

-
2025-07-21 16:21:09
-
2025-07-21 16:20:01
-
2025-07-21 16:18:51