标题:“人手一个贾维斯”的梦想正在变为现实
随着科技的发展,人工智能从概念走向了现实生活。2011年,苹果公司推出的iPhone 4s搭载了智能语音助手Siri,这一事件成为了智能助手领域的一大里程碑。虽然Siri经历了起起落落,但人们对拥有像《钢铁侠》中的贾维斯那样的智能助手的渴望从未消减。近年来,从AlphaGo到智能音箱再到大模型,人们一直在探讨:我们离拥有贾维斯式的智能助手还差多远?
2024年,这一梦想似乎即将实现。OpenAI宣布向部分付费用户开放GPT-4o的视频通话版本,该功能允许用户与GPT进行实时视频交互问答。智谱AI也推出了类似功能,通过文本、音频、图像和视频进行多模态互动和实时推理,成为首个实现这一功能的AI助手。这一创新引发了人们的关注:为什么头部大模型厂商都聚焦于“视频通话”功能?这一功能对用户体验有何影响?“人手一个贾维斯”的梦想能否变为现实?
大模型技术的热潮已持续近两年,AI助手层出不穷,但它们仍受限于文本输入和语音对话。智谱清言APP的“视频通话”功能,打破了这一局限,提供了全新的交互体验。它能识别摄像头拍摄的内容,理解语音指令,甚至在被打断时迅速作出反应,让用户仿佛与真人交流。这一功能在作业辅导、产品介绍和厨房助手等方面展现出了巨大潜力。
实现“视频通话”功能的关键在于多模态能力和快速推理速度。多模态能力使得AI能处理不同形式的信息输入和输出,而快速推理速度则确保了对话流畅性。智谱AI凭借其在多模态能力上的深厚积累和领先的技术实力,成为首个面向C端开放此功能的产品。
“视频通话”功能的引入标志着AI人机交互进入了一个新的阶段,它简化了用户界面,降低了使用门槛,为开发者提供了更广阔的创新空间。这一功能的普及将使AI在日常生活中的应用更加广泛,从作业辅导到产品介绍,从厨房助手到数字客服,每个场景都将受益于AI的强大能力。随着“视频通话”功能的广泛应用,大模型行业正加速迈向AGI时代,为用户提供前所未有的智能化体验。
.png)

-
2025-07-19 15:54:36
-
2025-07-19 15:54:26
-
2025-07-19 14:57:21