豆包推出实时语音大模型：号称中文对话断崖式领先、情商智商均在线

2025-01-20 17:21:52

量子思考者

发布在

快讯

阅读：2710

1月20日，豆包官方宣布推出实时语音大模型，并在豆包App新版中全量开放。该模型实现语音理解和生成一体化，提供端到端语音对话，具有低时延、可随时打断等特性，号称在中文对话方面“断崖式领先”。新功能还提升了语音的真实感及情绪表现，包括“喜怒哀乐”等复杂情感。此外，豆包App更新了实时语音通话功能，能自动调整节奏、儿化音、音量等细节，支持方言、英语对话及多角色模仿，甚至部分歌曲演唱。该技术基于端到端框架研发，深度融合语音与文本模态，力求达到“人机难辨”的AI交互效果。

原文链接

本文链接：https://kx.umi6.com/article/11908.html

转载请注明文章出处

实时语音大模型