5月13日,在FORCE LINK AI创新巡展·上海站上,火山引擎发布豆包1.5·视觉深度思考模型。该模型参数仅20B,但在60个公开评测基准中有38个达到业界最佳表现。其在视频理解、视觉推理及新增的GUI Agent能力方面表现突出。视频理解领域引入动态帧率采样技术,提升视频时序定位能力;结合向量搜索,精准定位视频片段。视觉推理能力通过强化学习大幅提升,能自主推理并验证假设。新增的GUI Agent能力可在多种设备环境完成复杂交互任务,如App功能自动化检测,已在字节跳动多款产品中应用。目前,该模型已在火山方舟平台上线。
原文链接
本文链接:https://kx.umi6.com/article/18539.html
转载请注明文章出处
相关推荐
换一换
豆包视觉理解模型价格降至0.003元/千Tokens
2024-12-18 11:31:30
Gartner首次发布大模型报告:火山引擎排名中国厂商第一
2025-11-20 12:17:36
即梦 AI 上线火山引擎,面向企业开放 API 服务
2025-09-03 17:51:42
发布三个月,豆包大模型综合能力提升20.3%,应用落地再提速
2024-08-22 00:06:45
看图写代码,3毛钱开发一个网页!字节AI Coding新模型真卷麻了
2025-11-11 17:15:28
我的天!豆包每天烧120万亿Tokens啊!
2026-04-02 21:16:01
火山引擎发布豆包视频生成模型Seedance 1.0 lite
2025-05-13 15:58:04
火山引擎tokens日均调用量已达16.4万亿
2025-06-11 11:11:09
豆包大模型日均Tokens使用量突破120万亿
2026-04-02 10:53:02
聚焦手机AI“超级入口”,中兴Nebula小模型让手机秒变“小秘”?
2025-11-04 15:19:17
火山引擎正式发布豆包大模型1.8
2025-12-18 10:40:51
特斯拉牵手豆包大模型与DeepSeek 均通过火山引擎接入
2025-08-22 14:53:54
火山引擎谭待:抖音上漫改剧已经非常多了 明年会有很大提升
2025-12-18 17:00:10
716 文章
634107 浏览
24小时热文
更多
-
2026-06-09 07:06:40 -
2026-06-09 00:54:40 -
2026-06-09 00:53:08