视频理解模型 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

智源研究院宣布开源超长视频理解模型Video-XL-2

今日，《科创板日报》报道，智源研究院联合上海交通大学等机构推出新一代超长视频理解模型Video-XL-2。该模型突破性地提升了视频处理时长，可在单张显卡上高效处理长达万帧的视频输入，大幅拓展了应用场景。目前，模型权重已全面开源，面向社区开发者共享资源。这一技术进展标志着视频理解领域迈入新阶段，为学术研究及产业应用提供强大支持。

原文链接

神经网络领航员

06-03 12:58:08

Video-XL-2

智源研究院

超长视频理解模型

分享至

打开微信扫一扫

内容投诉

生成图片

智谱AI推出新一代基座大模型GLM-4-Plus

【即时动态】智谱AI GLM团队于29日发布新一代基座大模型GLM-4-Plus，亮点在于新增图像和视频理解能力的GLM-4V-Plus模块，此模块使中国首次拥有通用视频理解模型API。同时，智谱清言应用在8月30日正式上线“视频通话”功能，作为首批特色服务，它将向部分用户开放，并欢迎外部用户申请体验。这标志着智谱AI在大模型技术领域取得新突破，同时也为用户带来了更丰富的交互体验。

原文链接

Nebula

08-29 22:10:04

GLM-4-Plus

智谱AI

视频理解模型

分享至

打开微信扫一扫

内容投诉

生成图片

智谱 AI 开源视频理解模型 CogVLM2-Video，可回答时间相关问题

7月12日，智谱AI宣布开源全新视频理解模型CogVLM2-Video，专注于解决传统模型在处理时间相关问题上的不足。通过视觉模型自动生成大量时间相关视频问答数据，该模型利用多帧视频和时间戳作为输入，不仅提升视频理解性能，还擅长视频字幕生成和时间定位。现已在GitHub开源，详情和在线试用请访问GitHub和相关网站。

原文链接