过去半年,AI语音赛道爆发,多家公司获大额融资。例如,Wispr Flow完成3000万美元A轮融资,ElevenLabs估值超30亿美元。Meta、OpenAI等巨头也积极布局语音模型。声智副总裁黄赟贺指出,语音对话因大模型加持进化为AI时代入口,声音首次实现“可编程化”,使语音交互迈向新阶段。然而,“听清”仍是技术难点,受物理限制需长期突破。未来,语音交互将从功能导向转向情感导向,通过情绪识别、意图理解等方式实现人机共情,并构建融合声学、视觉与语言的“声学世界模型”,推动具身智能发展。
原文链接
本文链接:https://kx.umi6.com/article/21126.html
转载请注明文章出处
相关推荐
.png)
换一换
DeepSeek月访问量超ChatGPT
2025-03-31 12:36:49
揭秘走进汽车工厂的中美人形机器人|硬氪分析
2024-07-10 11:27:42
AI应用爆发拉动算力基础设施需求!算力产业链服务器细分领域市占率居前的A股上市公司名单一览
2025-02-22 16:42:17
409 文章
57938 浏览
24小时热文
更多

-
2025-07-18 23:46:25
-
2025-07-18 22:47:06
-
2025-07-18 22:46:21