谷歌DeepMind CEO Demis Hassabis近日透露,谷歌计划融合Gemini AI模型与Veo视频生成模型,以增强Gemini对物理世界的理解能力。Gemini是谷歌打造的多模态基础模型,目标是构建一个能服务于现实世界的通用数字助手。目前,AI行业正向“全能”模型方向发展,Gemini不仅能生成图像和文本,还能生成音频,而OpenAI和亚马逊也在推进类似项目。Veo的视频数据主要来自YouTube,通过分析大量视频内容学习物理规律。谷歌表示,这些模型的训练需依赖海量数据,包括图像、视频、音频和文本等,且其模型可能依据与创作者的协议使用部分YouTube内容进行训练。该计划体现了谷歌在AI领域的进一步布局,时效性强,引发行业关注。
原文链接
本文链接:https://kx.umi6.com/article/17075.html
转载请注明文章出处
相关推荐
.png)
换一换
饿了么AI助手“小饿”上线:骑手普遍认为帮助很大
2025-06-24 16:20:17
谷歌推出虚拟穿衣应用Doppl
2025-06-30 11:46:10
谷歌引入AI反诈系统:利用语言模型分析潜在恶意网站
2025-05-11 17:22:05
471 文章
78912 浏览
24小时热文
更多

-
2025-07-20 17:06:49
-
2025-07-20 16:05:44
-
2025-07-20 16:05:36