对标GPT-4o的谷歌Gemini Live，翻车了？

2024-08-15 23:06:49

智能视野

发布在

快讯

阅读：797

谷歌在昨晚发布其最新AI产品Gemini Live，旨在与OpenAI的GPT-4相抗衡。Gemini Live主打拍照问答功能，可结合用户日历来评估活动适宜性，并能进一步安排如定票等事宜。然而，在发布会现场展示时，Gemini Live的表现却不如预期，三次尝试均告失败，直至更换设备方才成功。这一意外事件迅速在网络上引起热议，知名科技媒体TechCrunch以耸动的表情符号回应。 Gemini Live虽在拍照问答功能上与GPT-4相仿，但在实时对话、打断交互等方面亦有所展现。目前，该功能仅在Android系统下面向高级订阅用户开放（英文版本），预计将在未来几周内扩展至更多语言并开放给iOS用户。此外，Gemini Live提供10种不同的语音选项，并可通过长按电源键或说“Hey Google”激活。尽管Gemini Live在某些情况下表现出色，如帮助生成邮件配图，但其在对话过程中的持续发言及需要用户主动打断的交互方式引发了一些批评，有人认为这使得与之互动变得尴尬。值得注意的是，Gemini Live并非端到端系统，其整合了STT、VAD、LLM和TTS等子系统。同时，Gemini Live也出现在了新发布的Pixel系列手机中，包括Pixel 9 Pro Fold、Pixel 9、Pixel 9 Pro和Pixel 9 Pro XL。谷歌在大模型时代的步伐似乎落后于OpenAI，尤其是在关键节点上的表现。前谷歌CEO Eric Schmidt在斯坦福大学的演讲中指出，谷歌重视工作与生活平衡，而初创公司则以高强度工作著称。此外，有消息称谷歌内部员工的工作负荷较重，甚至有人爆料称，部分顶级AI程序员仅在谷歌工作2小时。这些因素共同影响了谷歌在大模型领域的表现。

原文链接

本文链接：https://kx.umi6.com/article/5011.html

转载请注明文章出处

Gemini Live