
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
5月13日,在FORCE LINK AI创新巡展·上海站上,火山引擎发布豆包1.5·视觉深度思考模型。该模型参数仅20B,但在60个公开评测基准中有38个达到业界最佳表现。其在视频理解、视觉推理及新增的GUI Agent能力方面表现突出。视频理解领域引入动态帧率采样技术,提升视频时序定位能力;结合向量搜索,精准定位视频片段。视觉推理能力通过强化学习大幅提升,能自主推理并验证假设。新增的GUI Agent能力可在多种设备环境完成复杂交互任务,如App功能自动化检测,已在字节跳动多款产品中应用。目前,该模型已在火山方舟平台上线。
原文链接
4月17日,在火山引擎AI创新巡展杭州站上,字节跳动发布豆包1.5深度思考模型,并升级文生图模型。该模型在数学、编程等领域表现出色,采用MoE架构,参数200B但激活参数仅20B,显著降低推理成本。此外,它还能结合视觉技术实现地貌分析、旅行辅助等功能。文生图模型升级至3.0版本,提升文字排版、图片生成精度及2k直出能力。视频搜索功能也得到增强,可精准定位答案。据谭待透露,截至2025年3月,豆包大模型日均tokens使用量超12.7万亿,较发布初期增长超106倍。
原文链接
加载更多

暂无内容