5月13日,在FORCE LINK AI创新巡展·上海站上,火山引擎发布豆包1.5·视觉深度思考模型。该模型参数仅20B,但在60个公开评测基准中有38个达到业界最佳表现。其在视频理解、视觉推理及新增的GUI Agent能力方面表现突出。视频理解领域引入动态帧率采样技术,提升视频时序定位能力;结合向量搜索,精准定位视频片段。视觉推理能力通过强化学习大幅提升,能自主推理并验证假设。新增的GUI Agent能力可在多种设备环境完成复杂交互任务,如App功能自动化检测,已在字节跳动多款产品中应用。目前,该模型已在火山方舟平台上线。
原文链接
本文链接:https://kx.umi6.com/article/18539.html
转载请注明文章出处
相关推荐
.png)
换一换
杀疯了!字节豆包视觉理解模型价格下降85%,火山引擎谭待:现在不太关注市场竞争
2024-12-18 17:35:19
豆包视觉理解模型惊艳亮相:首次评测就排名全球第二
2024-12-23 15:58:35
豆包视觉理解模型价格降至0.003元/千Tokens
2024-12-18 11:31:30
大模型商用格局雏形初现:Tokens用量决高下,火山引擎问鼎2024
2025-01-21 18:40:24
联想集团与火山引擎达成合作,为 AI 桌面助手“如意”植入豆包大模型
2024-12-26 20:42:21
字节跳动发布豆包 1.5 深度思考模型,同时升级文生图模型
2025-04-17 11:33:28
火山引擎发布豆包视频生成模型Seedance 1.0 lite
2025-05-13 15:58:04
字节火山引擎开发者大会即将开启 国产AI应用业绩有望快速释放
2024-12-18 08:26:03
火山引擎发布豆包大模型文旅解决方案
2024-08-16 08:22:19
火山引擎发布豆包视觉理解模型!龙头拿下连续两个20CM涨停,字节跳动旗下两大引擎A股合作商名单一览
2024-12-22 16:27:17
字节火山引擎谭待隔空回应百度沈抖:少做无端猜测,行业应聚焦基本功
2025-02-13 17:13:29
火山引擎又一AI盛会将启幕 “Al+游戏”有望加速落地
2025-05-09 07:43:05
特斯拉牵手豆包大模型与DeepSeek 均通过火山引擎接入
2025-08-22 14:53:54
508 文章
168998 浏览
24小时热文
更多

-
2025-09-07 06:42:57
-
2025-09-07 00:40:01
-
2025-09-06 23:39:46