1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

单卡搞定万帧视频理解!智源研究院开源轻量级超长视频理解模型Video-XL-2

国产开源模型再添亮点,智源研究院联合上海交通大学等机构发布新一代超长视频理解模型Video-XL-2。该模型可在单张显卡上高效处理长达万帧的视频输入,编码2048帧视频仅需12秒。

相较于上一代Video-XL,Video-XL-2在效果、长度、速度三方面全面升级。在MLVU、Video-MME、LVBench等主流评测中表现优异,接近甚至超越部分720亿参数大模型。同时,模型架构包含视觉编码器、动态Token合成模块及大语言模型三大核心组件,采用四阶段渐进式训练策略,确保强大理解力。

此外,Video-XL-2通过分段式预装填与双粒度KV解码机制优化效率,在单张24GB显卡上支持千帧视频处理,80GB显卡上可达万帧级。其在影视内容分析、异常行为监测等领域应用前景广阔,项目代码与模型已全面开源。

原文链接
本文链接:https://kx.umi6.com/article/19693.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
华为盘古 Ultra-MoE-718B-V1.1 正式开源并开放下载,模型权重与技术细节全面公开
2025-10-16 17:57:55
闭源主力选手拥抱开源?OpenAI 被曝最快下周推开源 AI 模型,o3 mini 级推理能力
2025-07-10 11:22:08
中国AI模型崛起!已拿下全球15%份额:一年前才1%
2026-01-19 17:05:01
10 万亿 tokens!英伟达贡献全球最大规模开源数据集,并推四大开源 AI 模型
2026-01-06 06:48:15
开源“裸考”真实世界,国产具身智能基座模型拿下全球第二!
2026-01-08 19:25:43
中国在开源 AI 模型市场首超美国,与 OpenAI 之“封闭”形成鲜明对比
2025-11-26 12:43:57
百元级硬件流畅运行百亿参数大模型!上交&本智激活开源端侧原生大模型
2025-07-27 18:00:02
AI出海,掘金一个时代
2026-02-07 10:06:40
华为盘古718B模型最新成绩:开源第二
2025-09-29 13:08:42
美国“SPAC之王”查马斯:公司已转用Kimi K2
2025-10-11 19:32:28
大模型年终观察,如何定义2025年的「好模型」?
2025-12-22 21:00:44
手机也能跑大模型,腾讯混元推出多款小尺寸开源模型
2025-08-04 17:00:39
月之暗面 Kimi K2 Thinking 训练成本被曝仅 460 万美元,性能超越数十亿美元投入的 OpenAI GPT 模型
2025-11-08 15:49:04
24小时热文
更多
扫一扫体验小程序