超长视频理解 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

智源研究院宣布开源超长视频理解模型Video-XL-2

今日，《科创板日报》报道，智源研究院联合上海交通大学等机构推出新一代超长视频理解模型Video-XL-2。该模型突破性地提升了视频处理时长，可在单张显卡上高效处理长达万帧的视频输入，大幅拓展了应用场景。目前，模型权重已全面开源，面向社区开发者共享资源。这一技术进展标志着视频理解领域迈入新阶段，为学术研究及产业应用提供强大支持。

原文链接

神经网络领航员

06-03 12:58:08

Video-XL-2

智源研究院

超长视频理解模型

分享至

打开微信扫一扫

内容投诉

生成图片

超长视频理解难平衡性能和效率

标题：超长视频理解：平衡性能与效率的新突破仅需一块80G显卡，大模型就能理解小时级超长视频。智源研究院联合上海交通大学、中国人民大学、北京大学和北京邮电大学等多所高校推出最新成果——超长视频理解大模型Video-XL。该模型借助语言模型（LLM）的压缩能力处理长视觉序列，不仅保持了短视频理解能力...

原文链接