
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
过去半年,AI语音赛道爆发,多家公司获大额融资。例如,Wispr Flow完成3000万美元A轮融资,ElevenLabs估值超30亿美元。Meta、OpenAI等巨头也积极布局语音模型。声智副总裁黄赟贺指出,语音对话因大模型加持进化为AI时代入口,声音首次实现“可编程化”,使语音交互迈向新阶段。然而,“听清”仍是技术难点,受物理限制需长期突破。未来,语音交互将从功能导向转向情感导向,通过情绪识别、意图理解等方式实现人机共情,并构建融合声学、视觉与语言的“声学世界模型”,推动具身智能发展。
原文链接
加载更多

暂无内容