1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

5月13日,《科创板日报》报道,字节跳动Seed团队发布视觉-语言多模态大模型Seed1.5-VL。该模型在超3Ttokens的多模态数据上预训练,具备强通用多模态理解和推理能力,且推理成本低。尽管其参数仅20B,但在60个评测基准中38个达到SOTA表现,尤其在视频和GUI任务中表现优异。与谷歌Gemini 2.5 Pro相比,Seed1.5-VL在部分任务中性能相当,但成本更低。模型在视觉定位、计数及GUI交互上有突出表现,但目标计数、复杂空间关系解析及视频动作推理等方面仍有不足。目前,Seed1.5-VL已通过火山引擎开放API供用户体验。国内外大厂纷纷布局多模态技术,全球AI竞争激烈,算力需求随之增长。

原文链接
本文链接:https://kx.umi6.com/article/18530.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
对话清华大学张亚勤:智能体是大模型时代的APP
2025-06-23 08:29:04
SuperCLUE多模态视觉评测榜:文心4.5 Turbo总分并列国内第一
2025-08-28 21:28:42
字节视觉-语言多模态大模型Seed VLM技术报告首次公开
2025-05-13 14:57:31
CVPR2025视频生成统一评估架构,上交x斯坦福联合提出让MLLM像人类一样打分
2025-06-12 17:39:33
Manus蝴蝶翅膀扇到杭州
2025-05-05 17:37:33
智能体洗牌“六小虎”,模型厂商如何转型?
2025-07-01 20:28:25
对话Genspark、Lovart、Simular.AI创始人:OpenAI入场是大利好,ARR绝非唯一重要的事
2025-07-27 10:53:25
世界模型版《模拟人生》
2025-06-24 11:15:47
医疗界迎来重磅大模型,还有10多个场景的智能体!
2025-04-11 10:37:36
第十三届互联网安全大会开幕:All In Agent
2025-08-06 12:27:42
蚂蚁集宣布正式开源统一多模态大模型Ming-lite-omni
2025-05-29 12:28:01
字节迭代多模态大模型 媲美谷歌新品 智能体能力更强、推理成本更低
2025-05-13 15:57:01
智能体生死局:80%创业者都死在这一关
2025-07-11 12:38:01
24小时热文
更多
扫一扫体验小程序