5月13日,在FORCE LINK AI创新巡展·上海站上,火山引擎发布豆包1.5·视觉深度思考模型。该模型参数仅20B,但在60个公开评测基准中有38个达到业界最佳表现。其在视频理解、视觉推理及新增的GUI Agent能力方面表现突出。视频理解领域引入动态帧率采样技术,提升视频时序定位能力;结合向量搜索,精准定位视频片段。视觉推理能力通过强化学习大幅提升,能自主推理并验证假设。新增的GUI Agent能力可在多种设备环境完成复杂交互任务,如App功能自动化检测,已在字节跳动多款产品中应用。目前,该模型已在火山方舟平台上线。
原文链接
本文链接:https://kx.umi6.com/article/18539.html
转载请注明文章出处
相关推荐
换一换
IDC:2025年上半年大模型公有云市场,火山引擎占比49.2%排名第一
2025-09-19 17:16:46
豆包视觉理解模型价格降至0.003元/千Tokens
2024-12-18 11:31:30
火山引擎正式发布豆包编程模型
2025-11-11 15:12:58
Tokens 经济崛起:IDC 报告揭示 AI 应用新风向,火山引擎领跑市场
2025-10-15 15:39:17
发布三个月,豆包大模型综合能力提升20.3%,应用落地再提速
2024-08-22 00:06:45
火山引擎,「出击」Agent
2025-06-17 12:22:02
火山引擎:豆包大模型日均 Tokens 调用量已突破 30 万亿
2025-10-16 16:57:47
火山引擎正式上线“大模型应用实验室”平台
2025-03-03 21:39:45
字节跳动发布豆包 1.5 深度思考模型,同时升级文生图模型
2025-04-17 11:33:28
火山引擎tokens日均调用量已达16.4万亿
2025-06-11 11:11:09
聚焦手机AI“超级入口”,中兴Nebula小模型让手机秒变“小秘”?
2025-11-04 15:19:17
火山引擎发布豆包视频生成模型 Seedance 1.0 lite:影视级质量、速度大幅提升
2025-05-13 15:54:53
字节火山引擎开发者大会即将开启 国产AI应用业绩有望快速释放
2024-12-18 08:26:03
588 文章
327868 浏览
24小时热文
更多
-
2025-12-08 22:52:38 -
2025-12-08 22:51:57 -
2025-12-08 22:51:33