5月13日,《科创板日报》报道,字节跳动Seed团队发布视觉-语言多模态大模型Seed1.5-VL。该模型在超3Ttokens的多模态数据上预训练,具备强通用多模态理解和推理能力,且推理成本低。尽管其参数仅20B,但在60个评测基准中38个达到SOTA表现,尤其在视频和GUI任务中表现优异。与谷歌Gemini 2.5 Pro相比,Seed1.5-VL在部分任务中性能相当,但成本更低。模型在视觉定位、计数及GUI交互上有突出表现,但目标计数、复杂空间关系解析及视频动作推理等方面仍有不足。目前,Seed1.5-VL已通过火山引擎开放API供用户体验。国内外大厂纷纷布局多模态技术,全球AI竞争激烈,算力需求随之增长。
原文链接
本文链接:https://kx.umi6.com/article/18530.html
转载请注明文章出处
相关推荐
换一换
谷歌DeepMind:AI独立创造价值的经济层正在形成
2025-09-16 15:13:08
行业首个:vivo 蓝心 3B 端侧多模态大模型发布,10B 以内总榜第一
2025-10-11 10:05:00
2025人工智能计算大会观察:token成本成AI应用规模化瓶颈 行业寻求算力“破局”
2025-09-27 14:41:56
ISC.AI 2025创新百强颁奖典礼落幕,首发智能体专家驱动产业升级
2025-12-18 12:41:46
重构AI在数字和物理世界的生产力,生数科技完成超6亿元A+轮融资
2026-02-06 03:28:59
荣耀设立20亿激励资源 提升智能体和MagicOS生态体验力度
2025-10-23 18:14:34
前阿里千问负责人林俊旸离职后首发长文:从训练模型转向训练智能体
2026-03-27 15:04:39
荣耀董事长吴晖:已累计投入超100亿元用于AI研发
2025-10-23 12:03:24
2500元/月雇个总监级AI数字员工,贵吗?
2025-12-25 22:01:56
GAIR 2025 世界模型论坛:走向真实智能的起点
2025-11-30 16:20:12
微软亮剑智能办公:解决“知行不一”难题,让 AI 替你干活、老板还夸你效率高
2025-11-18 11:12:22
DeepSeek新大招曝光:下一步智能体
2025-09-05 10:15:28
拒绝“概念”要“实效”:百度智能云详解Agent Infra如何让智能体成为真正生产力
2025-11-17 20:39:52
770 文章
686052 浏览
24小时热文
更多
-
2026-06-09 00:54:40 -
2026-06-09 00:53:08 -
2026-06-08 23:49:41