标题:字节Seed推出全新智能体UI-TARS-2,一个模型搞定多平台操作
正文:
字节Seed团队发布了最新智能体UI-TARS-2,能够自主操作手机、电脑和浏览器,完成复杂任务。例如,它仅用35秒就编写了一个重量单位转换函数,并计算出结果为4000克。相比Claude和OpenAI的同类模型,UI-TARS-2表现更优,接近人类水平。
UI-TARS-2的核心亮点在于“多轮强化学习”,解决了智能体操作图形界面(GUI)的四大难题:数据稀缺、环境割裂、能力单一和训练不稳定。其设计框架包括统一的Agent架构、多模态感知与交互、混合操作流,以及支持跨平台操作的沙盒环境。
在数据方面,UI-TARS-2通过“数据飞轮”机制,利用冷启动、多轮迭代和循环增强,逐步优化模型能力。针对强化学习中的奖励稀疏问题,团队设计了明确的任务奖励机制,并采用异步rollout和PPO算法优化,提升模型稳定性。此外,UI-TARS-2融合了GUI操作、终端命令和API调用,突破了单一界面的限制,适配多种场景需求。
测试结果显示,UI-TARS-2在多个权威GUI任务中表现优异,例如OSWorld、WindowsAgentArena等。它还能流畅运行15款小游戏,平均得分达人类水平的60%,部分游戏甚至超越人类。复杂任务如查资料、写代码修bug也得心应手。
论文链接:https://arxiv.org/abs/2509.02544
演示地址:https://seed-tars.com/showcase/ui-tars-2/
原文链接
本文链接:https://kx.umi6.com/article/24750.html
转载请注明文章出处
相关推荐
换一换
字节Seed发布扩散语言模型,推理速度达2146 tokens/s,比同规模自回归快5.4倍
2025-08-01 15:00:45
字节Seed最新版原生智能体来了!一个模型搞定手机/电脑/浏览器自主操作
2025-09-05 13:18:29
字节发了个机器人全能大模型,带队人李航
2025-09-06 12:34:33
字节Seed智能体模型UI-TARS-1.5开源
2025-04-17 19:52:37
研究显示:低质数据可令 AI“大脑退化”,OpenAI 奥尔特曼担心的“死网论”正逐渐成真
2025-10-22 20:51:26
对冲基金大佬对AI热潮“敬而远之”,更青睐这项技术……
2025-10-23 16:10:22
强脑科技在成都设新公司 含AI相关业务
2025-10-23 14:07:29
三星在电视端首发 Perplexity AI 应用程序,带来更具创新性 AI 体验
2025-10-23 10:05:39
小米汽车副总裁李肖爽否认宣传“SOS 1秒接通”:系造谣诋毁 将追责
2025-10-23 08:59:40
全球首个百亿级可部署基因组基础模型诞生
2025-10-23 07:59:17
GDP增长5.5%!人工智能、半导体等产业快速增长 上海经济实现奋力一跳
2025-10-22 15:47:08
上海开展2025年度中试平台培育储备征集申报工作 涉及集成电路、人工智能等领域
2025-10-22 15:49:20
通义千问Qwen3-VL家族新增两个Dense模型尺寸
2025-10-22 17:51:24
529 文章
259528 浏览
24小时热文
更多
-
2025-10-24 03:21:23 -
2025-10-24 01:20:07 -
2025-10-24 00:18:56