《科创板日报》17日消息,字节跳动旗下豆包大模型团队今日发布并开源了UI-TARS-1.5,这是一款基于视觉-语言模型打造的开源多模态智能体。该模型具备在虚拟环境中高效完成多种任务的能力,尤其在7个GUI图形用户界面评测基准中达到了SOTA(最高性能)。此外,UI-TARS-1.5首次展示了其在游戏中的长时推理能力和开放空间中的交互能力,标志着多模态智能体技术的重要进展。
原文链接
本文链接:https://kx.umi6.com/article/17367.html
转载请注明文章出处
相关推荐
.png)
换一换
DeepSeek会在全球AI竞争中沉沦吗?
2025-06-03 14:57:13
不玩噱头的北京,用数据和实力成就「全球开源之都」
2025-05-20 20:44:53
小红书开源首个大模型 预训练未使用合成数据
2025-06-10 09:46:30
业界首个,阿里通义万相“首尾帧生视频模型”开源
2025-04-17 23:53:37
阶跃星辰开源 3D 大模型 Step1X-3D,可生成高保真、可控的 3D 内容
2025-05-14 17:24:10
腾讯开源混元 3D 2.1 大模型:首个全链路开源工业级 3D 生成大模型,PC 也能“跑”
2025-06-14 07:22:03
字节跳动扣子 Coze 宣布开源:采用 Apache 2.0 许可证,支持商用
2025-07-26 15:40:54
英伟达开源9B参数小模型,比Qwen3快6倍
2025-08-19 16:03:42
DeepSeek-Prover-V2-671B 新模型开源发布
2025-04-30 19:50:58
人形机器人:最初的设想,最后的归宿
2025-04-22 08:09:04
Claude 团队打开大模型“脑回路”,推出开源 LLM 思维可视化工具
2025-05-31 23:12:07
性能比肩 Gemini-2.5 pro、o4-mini:阿里通义千问 Qwen 3 推理模型超级进化,现已开源
2025-07-26 00:31:49
腾讯智能体框架 Youtu-Agent 开源,搭建 Agent 只需两步
2025-09-02 16:34:48
484 文章
187288 浏览
24小时热文
更多

-
2025-09-10 09:31:39
-
2025-09-10 09:30:28
-
2025-09-10 08:33:06