过去半年,AI语音赛道爆发,多家公司获大额融资。例如,Wispr Flow完成3000万美元A轮融资,ElevenLabs估值超30亿美元。Meta、OpenAI等巨头也积极布局语音模型。声智副总裁黄赟贺指出,语音对话因大模型加持进化为AI时代入口,声音首次实现“可编程化”,使语音交互迈向新阶段。然而,“听清”仍是技术难点,受物理限制需长期突破。未来,语音交互将从功能导向转向情感导向,通过情绪识别、意图理解等方式实现人机共情,并构建融合声学、视觉与语言的“声学世界模型”,推动具身智能发展。
原文链接
本文链接:https://kx.umi6.com/article/21126.html
转载请注明文章出处
相关推荐
换一换
Karpathy 最新发文:别把 AI 当人看,它没欲望也不怕死
2025-11-22 19:29:36
字节跳动、阿里AI“大将”出走 大模型厂商中高层流动持续
2025-08-25 21:35:41
“雷军千万年薪要挖”的 DeepSeek 罗福莉官宣加入小米 Xiaomi MiMo 大模型团队
2025-11-12 14:05:32
豆包们,开始「上链接」
2025-10-27 10:54:08
字节&MAP重塑大模型推理算法优化重点,强化学习重在高效探索助力LLM提升上限
2025-08-11 10:59:04
把12个AI凑到一起打工,它们竟然搞起“小团体”?
2025-10-16 22:02:39
「今年业务是去年5倍以上」,工业智能体掀热潮
2025-08-29 12:38:30
真正的AI竞争力,藏在大模型“后训练”这一步
2025-10-13 16:59:55
大厂「AI」智能体,等待 DeepSeek 时刻
2025-07-31 11:05:08
AI玩具有多火?连马斯克都入场了
2025-07-29 21:36:44
中国中文信息学会2025学术年会暨第二届中国大模型大会(CIPS & CLM 2025)于10月28日在北京盛大开幕
2025-10-30 18:52:50
腾讯发布全新大模型混元3D 3.0
2025-09-16 10:11:57
把枯燥的工作先扔给大模型?
2025-08-15 12:12:45
576 文章
345801 浏览
24小时热文
更多
-
2025-12-08 22:52:38 -
2025-12-08 22:51:57 -
2025-12-08 22:51:33