1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
刚刚,谷歌深夜上新Veo 3.1!网友狂刷2.75亿条,Sora 2要小心了
2025年10月17日凌晨,谷歌发布视频生成模型Veo 3.1,新增叙事音频控制、首尾帧参考等功能,接入Gemini API与Vertex AI,用户可通过Flow或Gemini体验。新版本支持多人物场景生成、音画同步及最长148秒的视频片段,分辨率可达1080p/24fps。Flow平台数据显示,用户已生成超2.75亿个视频。新增功能提升了创意编辑能力,但成片质感较Veo 3进步有限,复杂场景表现仍有不足。此次更新被视为小升级,谷歌年底或将发布更大更新,可能结合Gemini 3全家桶。Sora 2或面临竞争压力。
幻彩逻辑RainbowLogic
10-17 22:25:46
Veo 3.1
视频生成模型
谷歌
分享至
打开微信扫一扫
内容投诉
生成图片
谷歌 Veo 3.1 视频生成模型发布:新增音频支持、对象添加等功能
10月16日,谷歌发布视频生成模型Veo 3.1,新增音频支持、对象添加及移除功能。新版本在音频输出、精细化编辑和图像转视频效果方面显著提升,可生成更逼真的视频片段并精准匹配用户提示词。Veo 3.1支持向视频中自然融入新对象,同时预告未来可在Flow工具中移除现有对象。此前功能如角色塑造、首尾帧生成视频及延长时间等也全面升级,现均支持音频。该模型正逐步部署至Flow、Gemini应用、Vertex AI及Gemini API平台。自5月Flow上线以来,用户已创作超2.75亿个视频。
神经网络领航员
10-16 07:47:17
视频生成模型
谷歌Veo 3.1
音频支持
分享至
打开微信扫一扫
内容投诉
生成图片
OpenAI 深夜炸场:家族最强视频生成模型 Sora 2 发布,还能同步生成音频
北京时间10月1日凌晨,OpenAI发布新一代视频生成模型Sora 2,新增音频生成功能,拟真效果和物理规律表现显著提升。用户可通过录制视频和语音完成身份验证,在生成内容中“客串”自己或他人。Sora 2应用已在iOS上架,采用邀请制,初期将在美国和加拿大开放,并提供宽松创作额度。OpenAI表示,未来可能推出付费生成选项以应对算力限制。为保障安全,系统会屏蔽不安全内容,所有视频均带水印与元数据标识,用户肖像仅在本人同意下使用。此外,OpenAI计划扩充人工审核团队,重点审查敏感内容。公司称,Sora 2是迈向通用世界模拟器的重要一步。
QuantumHacker
10-01 08:39:42
Sora 2
视频生成模型
音频生成
分享至
打开微信扫一扫
内容投诉
生成图片
字节跳动推出视频生成模型OmniHuman-1.5
8月28日,字节跳动推出全新视频生成模型OmniHuman-1.5。该模型结合多模态大语言模型与扩散Transformer技术,模拟‘深思规划’与‘直觉反应’两种思维模式,可生成超一分钟的高质量动态视频,支持流畅镜头运动、复杂角色互动及高度动态动作表现。这一创新标志着视频生成领域的重要突破,为内容创作带来更多可能性。
超频思维站
08-28 21:29:35
OmniHuman-1.5
字节跳动
视频生成模型
分享至
打开微信扫一扫
内容投诉
生成图片
阿里开源视频生成模型Wan2.2-S2V
8月26日,阿里开源多模态视频生成模型通义万相Wan2.2-S2V。该模型仅需一张静态图片和一段音频,即可生成面部表情自然、口型一致的电影级数字人视频,单次生成时长可达分钟级。这一技术突破为内容创作提供了高效工具,展现了AI在视频生成领域的潜力。
电子诗篇
08-26 22:55:59
视频生成模型
通义万相
阿里开源
分享至
打开微信扫一扫
内容投诉
生成图片
一张图即可生成电影级数字人视频:阿里云通义万相 Wan2.2-S2V 视频生成模型宣布开源
8月26日,阿里云宣布开源全新多模态视频生成模型通义万相 Wan2.2-S2V。该模型仅需一张静态图片和一段音频,即可生成面部表情自然、口型一致、动作流畅的电影级数字人视频,单次生成时长可达分钟级,大幅提升视频创作效率。模型支持真人、卡通、动物等多类型图片及肖像、半身、全身画幅,还可通过文本控制丰富视频内容。例如,上传人物弹钢琴照片、歌曲和文字,可生成高质量演奏视频,手指动作与音频节奏完美匹配。技术上,Wan2.2-S2V融合音频驱动和文本引导机制,采用层次化帧压缩技术实现稳定长视频生成,训练数据集超60万个音视频片段。实测显示其在FID、EFID、CSIM等指标上领先同类模型。自今年2月以来,通义万相已开源多款模型,下载量超2000万。
AI创想团
08-26 22:53:42
视频生成模型
通义万相
音频驱动
分享至
打开微信扫一扫
内容投诉
生成图片
视频生成模型大盘点:谁能定义下一代内容?
自2024年起,AI生成视频技术迎来爆发式增长,以OpenAI的Sora为代表,突破了时长、清晰度与逻辑一致性等瓶颈。随后,Runway Gen-3、快手可灵等模型相继推出,2025年上半年更是呈现井喷趋势,阿里、字节等大厂及MiniMax等创业公司纷纷入局。尽管市场尚未形成头部垄断,但快手、字节等国内厂商在评测和用户使用率中位列第一梯队。AI大幅降低了视频制作成本,满足短视频需求,成为创作者增效工具。然而,模板化生产虽高效却难以创造经典内容,部分厂商如Runway转向高端影视领域,探索高质量生成模式,定义AI工具的使用边界仍是行业关键问题。
代码编织者
08-07 20:57:55
AI视频
内容创作
视频生成模型
分享至
打开微信扫一扫
内容投诉
生成图片
阿里开源电影级视频生成模型通义万相2.2
7月28日,阿里开源电影级视频生成模型通义万相2.2。该模型单次可生成5秒高清视频,包含文生视频、图生视频和统一视频生成三款模型。其中,文生视频和图生视频模型为业界首个采用MoE架构的视频生成模型,总参数量27B,激活参数14B,由高噪声专家模型和低噪声专家模型组成,分别负责视频布局与细节优化,在同参数规模下节省约50%计算资源。这一发布展现了阿里在AI视频生成领域的技术突破。(记者 黄心怡)
虚拟织梦者
07-28 21:20:36
MoE架构
视频生成模型
通义万相
分享至
打开微信扫一扫
内容投诉
生成图片
阿里巴巴开源视频生成模型通义万相 Wan2.2,首创电影美学控制系统
7月28日,阿里巴巴开源视频生成模型通义万相 Wan2.2,包括文生视频、图生视频和统一视频生成三款模型。其中,文生视频和图生视频模型首次采用MoE架构,总参数量27B,激活参数14B,并引入电影美学控制系统,光影、色彩等能力媲美专业电影水平。新模型支持复杂运动、人物交互等场景,计算资源消耗减少约50%。同时,开源的5B小尺寸统一模型可在消费级显卡上部署,数分钟生成5秒高清视频。开发者可通过GitHub、HuggingFace等平台获取代码,企业可在阿里云调用API,用户也可在官网或App体验。自今年2月起,通义万相系列模型下载量已超500万。
心智奇点
07-28 21:19:42
电影美学控制系统
视频生成模型
通义万相
分享至
打开微信扫一扫
内容投诉
生成图片
谷歌在全球推出全新Veo 3视频生成模型
7月3日,谷歌宣布向159个国家和地区的Gemini用户推出全新Veo 3视频生成模型。该功能目前仅限Google AI Pro计划的付费订阅者使用,每日最多可生成三个视频。谷歌副总裁Josh Woodward透露,公司正研发为Gemini添加图像到视频生成功能,进一步拓展其AI应用能力。这一更新标志着谷歌在AI生成内容领域的持续创新,为用户提供更丰富的多媒体创作工具。
小阳哥
07-04 12:48:17
Gemini
Veo 3视频生成模型
谷歌
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序