1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

微软近日开源了名为OmniParser的纯视觉GUI智能工具,该工具能够解析和识别屏幕上的可交互图标,无需依赖HTML标签或视图层次结构。传统自动化方法受限于非网络环境,而现有视觉语言模型(如GPT-4V)难以准确解读复杂GUI元素。OmniParser结合了交互区域检测、图标描述和OCR模块,可在桌面、移动设备和网页上跨平台工作,显著提升用户界面解析准确性。据基准测试显示,OmniParser在ScreenSpot数据集上的准确率提升了73%,并使GPT-4V的图标正确标记率从70.5%提升至93.8%。该工具已发布在Hugging Face平台上,有助于推动多模态AI在无障碍、自动化和智能用户辅助领域的应用。 摘要时间:10月29日(原文发布时间)

原文链接
本文链接:https://kx.umi6.com/article/7987.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
国金证券:AI与“反内卷”或成2026年A股主线
2026-01-19 17:05:45
算力,终于像电一样被「发明」出来了
2026-01-14 11:33:54
一道50米洗车题让全网AI翻车!实测:豆包元宝等国产大模型都懵逼了 仅Gemini秒懂
2026-02-11 17:35:22
巴菲特谢幕,手握万亿资金的继任者会加速拥抱AI吗?
2025-12-29 15:33:48
AI引爆存储芯片需求!SK海力士将豪掷近130亿美元建设封装厂
2026-01-13 16:46:52
2026节点增长大会圆满收官,40位重磅嘉宾的增长之道请查收!
2025-12-31 13:18:57
时薪 3500,4 万人抢着给 AI 打工
2026-02-06 03:30:07
对话「哈萨比斯传」作者:“他不喜欢奥特曼”
2026-03-11 18:22:42
新年阿里开工第一站!马云现身云谷学校交流AI:核心管理层全部聚齐
2026-03-03 23:43:23
美的集团加码AI 拟未来三年投入超600亿元
2026-03-11 18:29:29
猝不及防,Adobe关停2D动画软件Animate拥抱AI!最惨学生:一学期的课白上了
2026-02-03 16:45:29
华为云CEO周跃峰:公有云用AI已成行业主流
2026-03-20 15:41:53
AI拉动需求劲增,存储芯片全年涨价“无悬念”
2026-03-17 07:09:39
24小时热文
更多
扫一扫体验小程序