1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

《科创板日报》17日消息,字节跳动旗下豆包大模型团队今日发布并开源了UI-TARS-1.5,这是一款基于视觉-语言模型打造的开源多模态智能体。该模型具备在虚拟环境中高效完成多种任务的能力,尤其在7个GUI图形用户界面评测基准中达到了SOTA(最高性能)。此外,UI-TARS-1.5首次展示了其在游戏中的长时推理能力和开放空间中的交互能力,标志着多模态智能体技术的重要进展。

原文链接
本文链接:https://kx.umi6.com/article/17367.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
智谱上线并开源文本转语音模型 GLM-TTS:只需 3 秒语音样本即可克隆声音
2025-12-11 10:42:18
小扎改口不开源,Meta股价暴涨12%
2025-08-01 08:56:20
群核科技发布空间大模型,或解决视频生成时空一致性难题
2025-08-26 14:47:34
阿里宣布Qwen3.5开源家族扩容
2026-02-25 12:17:28
大厂AI各走「开源」路
2025-10-17 09:09:57
阶跃星辰开源GUI Agent技术和4B GUI Agent模型
2025-12-01 15:15:24
华为昇腾 0Day 支持 DeepSeek-V3.2-Exp,面向开发者开源所有推理代码和算子实现
2025-09-29 20:14:51
英伟达开源Newton引擎与GR00T N1.6模型
2025-09-30 08:28:35
小米语音首席科学家:AI发展的本质就像生物进化,不开源要慢1000倍 | MEET2026
2025-12-16 09:28:45
李开复:如果十年后回顾 DeepSeek 如何让中国未落后美国,答案是开源
2025-09-27 12:40:23
阿里开源视觉理解模型Qwen3-VL
2025-09-24 14:43:41
外滩大会今年太AI了!王坚暴论:OpenAI确实站在了历史错误的一边
2025-09-12 12:10:41
马斯克宣布Grok-2正式开源 Grok-3也将在大概6个月内开源
2025-08-24 18:18:35
24小时热文
更多
扫一扫体验小程序