谷歌计划融合 Gemini 与 Veo 模型，打造全能 AI 助手

2025-04-13 09:32:04

新智燎原

发布在

快讯

阅读：758

谷歌DeepMind CEO Demis Hassabis近日透露，谷歌计划融合Gemini AI模型与Veo视频生成模型，以增强Gemini对物理世界的理解能力。Gemini是谷歌打造的多模态基础模型，目标是构建一个能服务于现实世界的通用数字助手。目前，AI行业正向“全能”模型方向发展，Gemini不仅能生成图像和文本，还能生成音频，而OpenAI和亚马逊也在推进类似项目。Veo的视频数据主要来自YouTube，通过分析大量视频内容学习物理规律。谷歌表示，这些模型的训练需依赖海量数据，包括图像、视频、音频和文本等，且其模型可能依据与创作者的协议使用部分YouTube内容进行训练。该计划体现了谷歌在AI领域的进一步布局，时效性强，引发行业关注。

原文链接

本文链接：https://kx.umi6.com/article/17075.html

转载请注明文章出处

AI助手