
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
今日,《科创板日报》报道,智源研究院联合上海交通大学等机构推出新一代超长视频理解模型Video-XL-2。该模型突破性地提升了视频处理时长,可在单张显卡上高效处理长达万帧的视频输入,大幅拓展了应用场景。目前,模型权重已全面开源,面向社区开发者共享资源。这一技术进展标志着视频理解领域迈入新阶段,为学术研究及产业应用提供强大支持。
原文链接
【即时动态】智谱AI GLM团队于29日发布新一代基座大模型GLM-4-Plus,亮点在于新增图像和视频理解能力的GLM-4V-Plus模块,此模块使中国首次拥有通用视频理解模型API。同时,智谱清言应用在8月30日正式上线“视频通话”功能,作为首批特色服务,它将向部分用户开放,并欢迎外部用户申请体验。这标志着智谱AI在大模型技术领域取得新突破,同时也为用户带来了更丰富的交互体验。
原文链接
7月12日,智谱AI宣布开源全新视频理解模型CogVLM2-Video,专注于解决传统模型在处理时间相关问题上的不足。通过视觉模型自动生成大量时间相关视频问答数据,该模型利用多帧视频和时间戳作为输入,不仅提升视频理解性能,还擅长视频字幕生成和时间定位。现已在GitHub开源,详情和在线试用请访问GitHub和相关网站。
原文链接
加载更多

暂无内容