1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

单卡搞定万帧视频理解!智源研究院开源轻量级超长视频理解模型Video-XL-2

国产开源模型再添亮点,智源研究院联合上海交通大学等机构发布新一代超长视频理解模型Video-XL-2。该模型可在单张显卡上高效处理长达万帧的视频输入,编码2048帧视频仅需12秒。

相较于上一代Video-XL,Video-XL-2在效果、长度、速度三方面全面升级。在MLVU、Video-MME、LVBench等主流评测中表现优异,接近甚至超越部分720亿参数大模型。同时,模型架构包含视觉编码器、动态Token合成模块及大语言模型三大核心组件,采用四阶段渐进式训练策略,确保强大理解力。

此外,Video-XL-2通过分段式预装填与双粒度KV解码机制优化效率,在单张24GB显卡上支持千帧视频处理,80GB显卡上可达万帧级。其在影视内容分析、异常行为监测等领域应用前景广阔,项目代码与模型已全面开源。

原文链接
本文链接:https://kx.umi6.com/article/19693.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
杨植麟被梁文锋叫醒了!Kimi新模型发布即开源,1T参数全线SOTA
2025-07-12 13:50:53
美国“SPAC之王”查马斯:公司已转用Kimi K2
2025-10-11 19:32:28
倪光南院士:报告显示 80% 的美国 AI 创新企业使用中国开源模型
2025-11-14 11:53:25
过去一年,中国AI如何改变全球开源格局?
2026-01-22 13:56:28
中国AI模型崛起!已拿下全球15%份额:一年前才1%
2026-01-19 17:05:01
OpenAI 推出两款开源模型 gpt-oss-120b / 20b,性能逼近 o4-mini/o3-mini
2025-08-06 08:23:05
最强3B「小钢炮」,代码数据全公开!推理随意开关,128k超长上下文
2025-07-11 11:34:58
微博自研VibeThinker开源模型:训练成本仅7800美元
2025-11-18 15:27:09
OpenAI再次推迟发布开源模型
2025-07-14 08:16:03
宇树:开源机器人世界大模型!
2025-09-16 13:11:33
开放全栈!超越π0,具身智能基础大模型迎来真·开源,开发者狂喜
2025-09-08 13:58:15
Moltbot作者被Claude刁难后:MiniMax M2.1是最优秀的开源模型
2026-01-29 14:21:07
群核科技升级空间智能战略,发布两款空间开源模型
2025-08-25 17:31:32
24小时热文
更多
扫一扫体验小程序