1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

5月13日,《科创板日报》报道,字节跳动Seed团队发布视觉-语言多模态大模型Seed1.5-VL。该模型在超3Ttokens的多模态数据上预训练,具备强通用多模态理解和推理能力,且推理成本低。尽管其参数仅20B,但在60个评测基准中38个达到SOTA表现,尤其在视频和GUI任务中表现优异。与谷歌Gemini 2.5 Pro相比,Seed1.5-VL在部分任务中性能相当,但成本更低。模型在视觉定位、计数及GUI交互上有突出表现,但目标计数、复杂空间关系解析及视频动作推理等方面仍有不足。目前,Seed1.5-VL已通过火山引擎开放API供用户体验。国内外大厂纷纷布局多模态技术,全球AI竞争激烈,算力需求随之增长。

原文链接
本文链接:https://kx.umi6.com/article/18530.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
DeepMind哈萨比斯:智能体可以在Genie实时生成的世界里运行
2025-08-13 15:36:41
事关下一代大模型!斯坦福顶尖1%科学家许主洪加盟阿里通义
2025-09-30 12:26:16
国务院印发“人工智能+”行动意见 AI应用有望迎来爆发
2025-08-27 09:04:17
下手帮你干活直接交付结果,纳米AI超级搜索智能体发布
2025-06-12 11:29:59
大模型之后 智能体站上C位!科技企业争相布局|直击MWC上海
2025-06-20 08:59:01
4页绝密文件曝OpenAI野心!ChatGPT占领人类心智,25年致命杀招公开
2025-05-27 12:38:26
8月6日!ISC.AI 2025北京开幕,共迎智能新纪元
2025-08-04 18:01:39
AI应用如何落地政企?首先不要卷通用大模型
2025-08-12 19:22:50
行业首个:vivo 蓝心 3B 端侧多模态大模型发布,10B 以内总榜第一
2025-10-11 10:05:00
基础设施进入 Agent 时代:无问芯穹的“蜂群式”尝试
2025-09-24 16:47:08
多模态通用感知能力超越 GPT-5,上海 AI 实验室开源书生・万象 3.5 大模型
2025-09-03 21:51:48
对话Genspark、Lovart、Simular.AI创始人:OpenAI入场是大利好,ARR绝非唯一重要的事
2025-07-27 10:53:25
商汤「日日新V6.5」登顶OpenCompass全球多模态大模型榜单
2025-09-10 17:39:23
24小时热文
更多
扫一扫体验小程序