
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
7月12日,智谱AI宣布开源全新视频理解模型CogVLM2-Video,专注于解决传统模型在处理时间相关问题上的不足。通过视觉模型自动生成大量时间相关视频问答数据,该模型利用多帧视频和时间戳作为输入,不仅提升视频理解性能,还擅长视频字幕生成和时间定位。现已在GitHub开源,详情和在线试用请访问GitHub和相关网站。
原文链接
加载更多

暂无内容