在2026年5月20日的Google I/O大会上,谷歌发布全新Gemini Omni模型,支持文本、图像、音频、视频跨模态生成与编辑。其核心亮点是强大的深度视频编辑能力,用户可通过自然语言指令添加或删除对象、切换摄像机角度、修改环境与风格,生成内容高度连贯且能推测后续情节。首发产品Gemini Omni Flash已在Gemini应用上线,并向Google AI订阅用户及YouTube Shorts创作者免费开放。此外,谷歌嵌入SynthID数字水印技术,确保生成内容可追踪验证。谷歌DeepMind负责人表示,该模型正推动AI向通用人工智能(AGI)迈进。
原文链接
本文链接:https://kx.umi6.com/article/36027.html
转载请注明文章出处
相关推荐
换一换
字节开源统一框架Bernini:给DiT配个“大模型军师”,AI视频编辑先理解再动手
2026-06-02 18:37:35
Meta 推出 AI 视频编辑功能:可轻松更换服装、场景、风格
2025-06-12 08:32:36
Pika新功能可以往视频里添加一切!网友:每月省5000美元
2025-02-07 16:59:18
Adobe 演示 AI 黑科技:改一帧,整段视频自动同步编辑
2025-11-01 12:27:20
谷歌 AI 视频编辑应用 Google Vids 上线:帮你写脚本、剪片、找素材等
2024-11-09 08:41:43
阿里视频生成大模型Wan2.7登顶DesignArena榜单
2026-04-10 20:28:11
Meta AI新增生成式AI视频编辑功能:秒换服装、场景
2025-06-13 11:08:49
一个平平无奇的产品,如何在最卷赛道突围?
2024-11-28 10:25:49
3个月流量增长10倍至千万,平平无奇的产品在最卷赛道突围?
2024-11-29 14:57:39
WorldClaw与百度智能云达成战略合作,文心5.0系列登陆WorldRouter
2026-07-03 16:03:23
豆包:智能体功能将于7月15日下线
2026-07-04 07:38:46
旗舰受困 升级Sonnet 5救场 能力直追Opus
2026-07-01 17:20:30
Om AI联汇发布VLX:全球首个面向物理世界的端侧流式多模态模型
2026-07-01 12:04:42
688 文章
675057 浏览
24小时热文
更多
-
2026-07-04 23:08:47 -
2026-07-04 22:07:26 -
2026-07-04 14:52:01