综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2025年10月17日凌晨,谷歌发布视频生成模型Veo 3.1,新增叙事音频控制、首尾帧参考等功能,接入Gemini API与Vertex AI,用户可通过Flow或Gemini体验。新版本支持多人物场景生成、音画同步及最长148秒的视频片段,分辨率可达1080p/24fps。Flow平台数据显示,用户已生成超2.75亿个视频。新增功能提升了创意编辑能力,但成片质感较Veo 3进步有限,复杂场景表现仍有不足。此次更新被视为小升级,谷歌年底或将发布更大更新,可能结合Gemini 3全家桶。Sora 2或面临竞争压力。
原文链接
10月16日,谷歌发布视频生成模型Veo 3.1,新增音频支持、对象添加及移除功能。新版本在音频输出、精细化编辑和图像转视频效果方面显著提升,可生成更逼真的视频片段并精准匹配用户提示词。Veo 3.1支持向视频中自然融入新对象,同时预告未来可在Flow工具中移除现有对象。此前功能如角色塑造、首尾帧生成视频及延长时间等也全面升级,现均支持音频。该模型正逐步部署至Flow、Gemini应用、Vertex AI及Gemini API平台。自5月Flow上线以来,用户已创作超2.75亿个视频。
原文链接
10月10日,科技媒体testingcatalog曝光谷歌新一代文生视频模型Veo 3.1的首批生成样本。该模型可生成8秒、720p分辨率且自带音轨的视频片段,目前已在云平台Vertex AI及Google Vids中现身。相比前代,Veo 3.1在细节表现和视觉保真度上显著提升,如精准呈现熔岩流动感或逼真的恐龙形态,并修复了物体比例失调等问题。从“赛博朋克黑客机器人”和“火山喷发”等测试视频来看,其性能飞跃明显,配乐更具感染力,目标直指Sora 2。
原文链接
加载更多
暂无内容