标题:字节Seed推出全新智能体UI-TARS-2,一个模型搞定多平台操作
正文:
字节Seed团队发布了最新智能体UI-TARS-2,能够自主操作手机、电脑和浏览器,完成复杂任务。例如,它仅用35秒就编写了一个重量单位转换函数,并计算出结果为4000克。相比Claude和OpenAI的同类模型,UI-TARS-2表现更优,接近人类水平。
UI-TARS-2的核心亮点在于“多轮强化学习”,解决了智能体操作图形界面(GUI)的四大难题:数据稀缺、环境割裂、能力单一和训练不稳定。其设计框架包括统一的Agent架构、多模态感知与交互、混合操作流,以及支持跨平台操作的沙盒环境。
在数据方面,UI-TARS-2通过“数据飞轮”机制,利用冷启动、多轮迭代和循环增强,逐步优化模型能力。针对强化学习中的奖励稀疏问题,团队设计了明确的任务奖励机制,并采用异步rollout和PPO算法优化,提升模型稳定性。此外,UI-TARS-2融合了GUI操作、终端命令和API调用,突破了单一界面的限制,适配多种场景需求。
测试结果显示,UI-TARS-2在多个权威GUI任务中表现优异,例如OSWorld、WindowsAgentArena等。它还能流畅运行15款小游戏,平均得分达人类水平的60%,部分游戏甚至超越人类。复杂任务如查资料、写代码修bug也得心应手。
论文链接:https://arxiv.org/abs/2509.02544
演示地址:https://seed-tars.com/showcase/ui-tars-2/
原文链接
本文链接:https://kx.umi6.com/article/24750.html
转载请注明文章出处
相关推荐
.png)
换一换
字节Seed智能体模型UI-TARS-1.5开源
2025-04-17 19:52:37
字节Seed最新版原生智能体来了!一个模型搞定手机/电脑/浏览器自主操作
2025-09-05 13:18:29
字节Seed发布扩散语言模型,推理速度达2146 tokens/s,比同规模自回归快5.4倍
2025-08-01 15:00:45
马斯克的“金色擎天柱”:特斯拉全新人形机器人曝光,仿生手部引热议、疑似 Optimus 3 原型
2025-09-04 16:04:04
即梦 AI 上线火山引擎,面向企业开放 API 服务
2025-09-03 17:51:42
上海AI实验室开源通用多模态大模型书生·万象3.5
2025-09-03 20:52:29
人形机器人再现亿元级订单!ToB市场爆发 大模型创新或成关键胜负手
2025-09-04 10:01:21
报道称DeepSeek计划年底前发布AI智能体 公司暂无回应
2025-09-04 17:05:24
ChatGPT新功能,又干掉一批创业项目
2025-09-05 13:21:19
两部门:支持人工智能、先进存储、三维异构集成芯片、全固态电池等前沿技术方向基础研究
2025-09-04 15:10:11
9.16-9.17来腾讯全球数字生态大会,与行业大咖「智者见智」共话AI增益新机
2025-09-04 20:06:13
无惧AI竞赛落后?华尔街评论员:苹果仅凭生态就握有“王牌”
2025-09-04 22:10:45
2025世界智能产业博览会今天开幕
2025-09-05 08:16:16
469 文章
165473 浏览
24小时热文
更多

-
2025-09-05 14:21:15
-
2025-09-05 14:20:06
-
2025-09-05 13:22:16