1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

5月13日,在FORCE LINK AI创新巡展·上海站上,火山引擎发布豆包1.5·视觉深度思考模型。该模型参数仅20B,但在60个公开评测基准中有38个达到业界最佳表现。其在视频理解、视觉推理及新增的GUI Agent能力方面表现突出。视频理解领域引入动态帧率采样技术,提升视频时序定位能力;结合向量搜索,精准定位视频片段。视觉推理能力通过强化学习大幅提升,能自主推理并验证假设。新增的GUI Agent能力可在多种设备环境完成复杂交互任务,如App功能自动化检测,已在字节跳动多款产品中应用。目前,该模型已在火山方舟平台上线。

原文链接
本文链接:https://kx.umi6.com/article/18539.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
字节豆包大模型已支持实时语音通话
2024-08-09 15:49:47
火山引擎发布豆包视频生成模型Seedance 1.0 lite
2025-05-13 15:58:04
火山引擎发布豆包视觉理解模型!龙头拿下连续两个20CM涨停,字节跳动旗下两大引擎A股合作商名单一览
2024-12-22 16:27:17
24小时热文
更多
扫一扫体验小程序