1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

《科创板日报》17日消息,字节跳动旗下豆包大模型团队今日发布并开源了UI-TARS-1.5,这是一款基于视觉-语言模型打造的开源多模态智能体。该模型具备在虚拟环境中高效完成多种任务的能力,尤其在7个GUI图形用户界面评测基准中达到了SOTA(最高性能)。此外,UI-TARS-1.5首次展示了其在游戏中的长时推理能力和开放空间中的交互能力,标志着多模态智能体技术的重要进展。

原文链接
本文链接:https://kx.umi6.com/article/17367.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
大厂AI各走「开源」路
2025-10-17 09:09:57
1.5B参数撬动“吉卜力级”全能体验,国产开源之光多模态统一模型,来了
2025-07-30 12:43:45
行业首个 100% 开源的企业级智能体,京东云开源 JoyAgent
2025-07-26 11:37:17
超越 GPT-5 Nano,阿里通义 Qwen3-VL 系列全新成员 4B 与 8B 模型开源上线
2025-10-15 13:33:22
腾讯发布混元3D世界模型1.0:首个支持物理仿真的开源世界生成系统
2025-08-01 09:00:10
大模型开源后如何投资AI? 顶级创投看好中国企业“换道超车”的机会
2025-08-01 13:02:40
字节 Seed 开源统一多模态理解和生成模型 BAGEL
2025-06-03 19:01:17
腾讯混元3D-Omni、混元3D-Part发布并开源
2025-09-26 18:33:53
阿里云创始人王坚:人工智能时代将带来“计算卫星”
2025-09-11 15:59:12
DeepSeek开源新版R1 媲美OpenAI最高o3模型
2025-05-29 05:51:14
阿里云通义千问开源 Qwen3-VL-30B-A3B 模型:智能体任务等领域媲美 GPT-5-Mini
2025-10-04 14:01:20
业界首个,腾讯混元 3D 世界模型正式发布并开源
2025-07-27 11:55:13
GitHub一周2000星!国产统一图像生成模型神器升级,理解质量双up,还学会了“反思”
2025-07-03 13:21:28
24小时热文
更多
扫一扫体验小程序