《科创板日报》17日消息,字节跳动旗下豆包大模型团队今日发布并开源了UI-TARS-1.5,这是一款基于视觉-语言模型打造的开源多模态智能体。该模型具备在虚拟环境中高效完成多种任务的能力,尤其在7个GUI图形用户界面评测基准中达到了SOTA(最高性能)。此外,UI-TARS-1.5首次展示了其在游戏中的长时推理能力和开放空间中的交互能力,标志着多模态智能体技术的重要进展。
原文链接
本文链接:https://kx.umi6.com/article/17367.html
转载请注明文章出处
相关推荐
.png)
换一换
DeepSeek开源新模型,数学推理能力大提升
2025-05-01 09:16:24
一块简陋、能聊天的语音电路板 成为全网最火热的AI硬件
2025-04-11 00:18:11
Coze/Dify/FastGPT/N8N :该如何选择Agent平台?
2025-06-09 10:25:58
432 文章
75390 浏览
24小时热文
更多

-
2025-07-21 17:25:05
-
2025-07-21 17:23:59
-
2025-07-21 17:22:51