5月13日,在FORCE LINK AI创新巡展·上海站上,火山引擎发布豆包1.5·视觉深度思考模型。该模型参数仅20B,但在60个公开评测基准中有38个达到业界最佳表现。其在视频理解、视觉推理及新增的GUI Agent能力方面表现突出。视频理解领域引入动态帧率采样技术,提升视频时序定位能力;结合向量搜索,精准定位视频片段。视觉推理能力通过强化学习大幅提升,能自主推理并验证假设。新增的GUI Agent能力可在多种设备环境完成复杂交互任务,如App功能自动化检测,已在字节跳动多款产品中应用。目前,该模型已在火山方舟平台上线。
原文链接
本文链接:https://kx.umi6.com/article/18539.html
转载请注明文章出处
相关推荐
换一换
火山引擎回应汉得信息AI智能体相关合作:传言夸大
2025-01-24 16:48:18
特斯拉牵手豆包大模型与DeepSeek 均通过火山引擎接入
2025-08-22 14:53:54
字节火山引擎谭待隔空回应百度沈抖:少做无端猜测,行业应聚焦基本功
2025-02-13 17:13:29
Tokens 经济崛起:IDC 报告揭示 AI 应用新风向,火山引擎领跑市场
2025-10-15 15:39:17
火山引擎发布豆包最新图像编辑、同传模型,加速Agent开发落地
2025-07-30 13:44:44
火山引擎总裁回应豆包大模型定价:确保合理毛利 让AI技术普惠广大开发者
2024-12-20 12:29:13
火山引擎重磅大会将至!豆包迎来全线升级 Agent或成主角
2025-06-09 15:33:23
发布三个月,豆包大模型综合能力提升20.3%,应用落地再提速
2024-08-22 00:06:45
火山引擎升级和发布四款豆包大模型
2025-10-16 17:03:34
联想与火山引擎官宣合作,为AI桌面助手接入豆包大模型
2024-12-27 22:11:36
央视马年春晚独家AI云合作伙伴!火山引擎正式官宣
2025-12-29 13:22:11
字节火山引擎开发者大会即将开启 国产AI应用业绩有望快速释放
2024-12-18 08:26:03
火山引擎谭待:豆包日均使用量超过50万亿
2025-12-18 10:39:51
663 文章
457338 浏览
24小时热文
更多
-
2026-03-09 21:13:27 -
2026-03-09 20:09:26 -
2026-03-09 20:09:18