1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:字节Seed推出全新智能体UI-TARS-2,一个模型搞定多平台操作

正文:
字节Seed团队发布了最新智能体UI-TARS-2,能够自主操作手机、电脑和浏览器,完成复杂任务。例如,它仅用35秒就编写了一个重量单位转换函数,并计算出结果为4000克。相比Claude和OpenAI的同类模型,UI-TARS-2表现更优,接近人类水平。

UI-TARS-2的核心亮点在于“多轮强化学习”,解决了智能体操作图形界面(GUI)的四大难题:数据稀缺、环境割裂、能力单一和训练不稳定。其设计框架包括统一的Agent架构、多模态感知与交互、混合操作流,以及支持跨平台操作的沙盒环境。

在数据方面,UI-TARS-2通过“数据飞轮”机制,利用冷启动、多轮迭代和循环增强,逐步优化模型能力。针对强化学习中的奖励稀疏问题,团队设计了明确的任务奖励机制,并采用异步rollout和PPO算法优化,提升模型稳定性。此外,UI-TARS-2融合了GUI操作、终端命令和API调用,突破了单一界面的限制,适配多种场景需求。

测试结果显示,UI-TARS-2在多个权威GUI任务中表现优异,例如OSWorld、WindowsAgentArena等。它还能流畅运行15款小游戏,平均得分达人类水平的60%,部分游戏甚至超越人类。复杂任务如查资料、写代码修bug也得心应手。

论文链接:https://arxiv.org/abs/2509.02544
演示地址:https://seed-tars.com/showcase/ui-tars-2/

原文链接
本文链接:https://kx.umi6.com/article/24750.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
字节Seed最新版原生智能体来了!一个模型搞定手机/电脑/浏览器自主操作
2025-09-05 13:18:29
字节发了个机器人全能大模型,带队人李航
2025-09-06 12:34:33
字节Seed用化学思想搞AI,把DeepSeek-R1的脑回路拆成了分子结构
2026-02-24 15:50:28
字节Seed智能体模型UI-TARS-1.5开源
2025-04-17 19:52:37
字节Seed发布扩散语言模型,推理速度达2146 tokens/s,比同规模自回归快5.4倍
2025-08-01 15:00:45
2026年,AI初创全球化的「变与不变」|沙龙招募
2026-03-06 19:27:03
央视点赞千问APP,“AI办事”让人工智能走进日常生活
2026-03-07 16:42:54
全国人大代表杭迎伟:打造水务全产业链机器人矩阵
2026-03-06 19:29:11
苏州人工智能专项母基金等成立投资合伙企业 出资额5亿
2026-03-06 17:22:54
抖音电商打击AI虚假营销:处置仿冒李亚鹏、王丽云等名人侵权内容超16万条
2026-03-09 19:06:14
OpenClaw火出天际 工程院院士王坚:AI龙虾价格很快打下来
2026-03-08 19:34:04
英伟达投资的数据中心公司Nscale完成20亿美元融资 估值达146亿美元
2026-03-09 18:02:36
中信证券:看好Micro LED CPO产业趋势,上游芯片环节有望深度受益
2026-03-09 09:25:49
24小时热文
更多
扫一扫体验小程序