《科创板日报》17日消息,字节跳动旗下豆包大模型团队今日发布并开源了UI-TARS-1.5,这是一款基于视觉-语言模型打造的开源多模态智能体。该模型具备在虚拟环境中高效完成多种任务的能力,尤其在7个GUI图形用户界面评测基准中达到了SOTA(最高性能)。此外,UI-TARS-1.5首次展示了其在游戏中的长时推理能力和开放空间中的交互能力,标志着多模态智能体技术的重要进展。
原文链接
本文链接:https://kx.umi6.com/article/17367.html
转载请注明文章出处
相关推荐
换一换
通义千问最新AI编程大模型Qwen3-Coder正式开源
2025-07-23 07:45:34
性能比肩 Gemini-2.5 pro、o4-mini:阿里通义千问 Qwen 3 推理模型超级进化,现已开源
2025-07-26 00:31:49
小米开源首个原生端到端语音大模型
2025-09-19 10:10:03
DeepSeek昨天开源的新模型,有点邪门
2025-10-22 10:42:03
智谱GLM-4.7-Flash正式发布并开源
2026-01-20 08:45:53
马斯克背叛理想
2025-08-24 22:18:31
腾讯混元3D-Omni、混元3D-Part发布并开源
2025-09-26 18:33:53
美国《连线》杂志:再见,GPT5;你好,千问!
2025-12-29 15:27:00
腾讯混元开源翻译模型 1.5:手机 1GB 内存即可运行,效果超越商用 API
2025-12-30 16:27:33
“会操作手机的 AI”,智谱开源 AI Agent 模型 AutoGLM
2025-12-09 10:29:51
腾讯智能体框架 Youtu-Agent 开源,搭建 Agent 只需两步
2025-09-02 16:34:48
Kimi即将推出新一代万亿大模型:开源王者刷新 去年已超GPT5
2026-01-20 22:33:50
真如摄影、细至发丝!阿里开源新一代图像生成模型Qwen-Image
2025-12-31 21:40:29
633 文章
444648 浏览
24小时热文
更多
-
2026-01-23 09:43:53 -
2026-01-23 08:40:41 -
2026-01-23 06:34:26