1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

单卡搞定万帧视频理解!智源研究院开源轻量级超长视频理解模型Video-XL-2

国产开源模型再添亮点,智源研究院联合上海交通大学等机构发布新一代超长视频理解模型Video-XL-2。该模型可在单张显卡上高效处理长达万帧的视频输入,编码2048帧视频仅需12秒。

相较于上一代Video-XL,Video-XL-2在效果、长度、速度三方面全面升级。在MLVU、Video-MME、LVBench等主流评测中表现优异,接近甚至超越部分720亿参数大模型。同时,模型架构包含视觉编码器、动态Token合成模块及大语言模型三大核心组件,采用四阶段渐进式训练策略,确保强大理解力。

此外,Video-XL-2通过分段式预装填与双粒度KV解码机制优化效率,在单张24GB显卡上支持千帧视频处理,80GB显卡上可达万帧级。其在影视内容分析、异常行为监测等领域应用前景广阔,项目代码与模型已全面开源。

原文链接
本文链接:https://kx.umi6.com/article/19693.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
OpenAI对标DeepSeek的开源模型,本周就要来了?
2025-04-14 13:32:36
“开源王者”Llama4,却让DeepSeek们松了一口气
2025-04-07 08:47:00
谷歌前 CEO 施密特称中国领先的大模型皆为开源,呼吁中美开展合作
2025-07-26 16:43:43
让64张卡像一张卡!浪潮信息发布新一代AI超节点,支持四大国产开源模型同时运行
2025-08-11 16:03:42
阿里达摩院首次开源具身智能“三大件”机器人上下文协议
2025-08-11 13:01:00
MiniMax发布全球首个混合架构开源模型M1 称强化训练成本仅53万美金
2025-06-17 19:29:56
“我原以为AI六小虎为大厂探路,没想到连大厂都给DeepSeek探路”
2025-03-24 14:59:17
全球闲置算力训个模型,性能媲美R1,老黄“天塌了”
2025-05-16 14:29:01
全球最大开源视频模型,现在也Created in China了,阶跃出品
2025-02-18 13:15:12
一周六连发!昆仑万维将多模态AI卷到了新高度
2025-08-17 18:38:51
智谱发布新一代旗舰开源模型 GLM-4.5,专为智能体应用打造
2025-07-28 22:20:02
最强3B「小钢炮」,代码数据全公开!推理随意开关,128k超长上下文
2025-07-11 11:34:58
“大模型六虎”阶跃星辰3月将开源图生视频模型,并成立新的生态基金
2025-02-22 00:01:30
24小时热文
更多
扫一扫体验小程序