1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:字节Seed推出全新智能体UI-TARS-2,一个模型搞定多平台操作

正文:
字节Seed团队发布了最新智能体UI-TARS-2,能够自主操作手机、电脑和浏览器,完成复杂任务。例如,它仅用35秒就编写了一个重量单位转换函数,并计算出结果为4000克。相比Claude和OpenAI的同类模型,UI-TARS-2表现更优,接近人类水平。

UI-TARS-2的核心亮点在于“多轮强化学习”,解决了智能体操作图形界面(GUI)的四大难题:数据稀缺、环境割裂、能力单一和训练不稳定。其设计框架包括统一的Agent架构、多模态感知与交互、混合操作流,以及支持跨平台操作的沙盒环境。

在数据方面,UI-TARS-2通过“数据飞轮”机制,利用冷启动、多轮迭代和循环增强,逐步优化模型能力。针对强化学习中的奖励稀疏问题,团队设计了明确的任务奖励机制,并采用异步rollout和PPO算法优化,提升模型稳定性。此外,UI-TARS-2融合了GUI操作、终端命令和API调用,突破了单一界面的限制,适配多种场景需求。

测试结果显示,UI-TARS-2在多个权威GUI任务中表现优异,例如OSWorld、WindowsAgentArena等。它还能流畅运行15款小游戏,平均得分达人类水平的60%,部分游戏甚至超越人类。复杂任务如查资料、写代码修bug也得心应手。

论文链接:https://arxiv.org/abs/2509.02544
演示地址:https://seed-tars.com/showcase/ui-tars-2/

原文链接
本文链接:https://kx.umi6.com/article/24750.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
字节Seed智能体模型UI-TARS-1.5开源
2025-04-17 19:52:37
字节Seed最新版原生智能体来了!一个模型搞定手机/电脑/浏览器自主操作
2025-09-05 13:18:29
字节Seed发布扩散语言模型,推理速度达2146 tokens/s,比同规模自回归快5.4倍
2025-08-01 15:00:45
字节发了个机器人全能大模型,带队人李航
2025-09-06 12:34:33
全球首个AI美女演员诞生!星爵演员破大防怒喷
2026-01-21 23:30:59
广东:保障算力算法与网络供给 鼓励在重点路段、桥隧、港口及枢纽场站部署边缘计算节点
2026-01-21 16:20:44
深圳芯片「夫妻店」赴港IPO
2026-01-21 15:14:19
国产GPU厂商燧原科技科创板IPO获受理
2026-01-22 19:08:26
事关AI聊天机器人和自动驾驶!马斯克和奥尔特曼隔空互喷
2026-01-21 20:25:45
快手可灵AI月活突破1200万
2026-01-21 15:18:50
中信建投:2026年金价或弱于2025年 值得期待的是铜
2026-01-22 08:45:48
苏州“十五五”规划建议:深化投融资体制改革,积极发展股权、债券等直接融资
2026-01-21 20:29:06
没有商业模式,是DeepSeek最坚固的「护城河」
2026-01-21 14:10:41
24小时热文
更多
扫一扫体验小程序