1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

5月13日,《科创板日报》报道,字节跳动Seed团队发布视觉-语言多模态大模型Seed1.5-VL。该模型在超3Ttokens的多模态数据上预训练,具备强通用多模态理解和推理能力,且推理成本低。尽管其参数仅20B,但在60个评测基准中38个达到SOTA表现,尤其在视频和GUI任务中表现优异。与谷歌Gemini 2.5 Pro相比,Seed1.5-VL在部分任务中性能相当,但成本更低。模型在视觉定位、计数及GUI交互上有突出表现,但目标计数、复杂空间关系解析及视频动作推理等方面仍有不足。目前,Seed1.5-VL已通过火山引擎开放API供用户体验。国内外大厂纷纷布局多模态技术,全球AI竞争激烈,算力需求随之增长。

原文链接
本文链接:https://kx.umi6.com/article/18530.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
Manus终于开放注册!每天能免费玩一次
2025-05-13 09:46:59
高德发布 AI 导航智能体:高速驾车场景下可感知车道级交通流变化、事件事故
2025-04-14 16:40:41
Manus引爆智能体复现潮!DeepSeek已被整合,项目挤满开源榜
2025-03-09 13:42:28
24小时热文
更多
扫一扫体验小程序