1月20日,豆包官方宣布推出实时语音大模型,并在豆包App新版中全量开放。该模型实现语音理解和生成一体化,提供端到端语音对话,具有低时延、可随时打断等特性,号称在中文对话方面“断崖式领先”。新功能还提升了语音的真实感及情绪表现,包括“喜怒哀乐”等复杂情感。此外,豆包App更新了实时语音通话功能,能自动调整节奏、儿化音、音量等细节,支持方言、英语对话及多角色模仿,甚至部分歌曲演唱。该技术基于端到端框架研发,深度融合语音与文本模态,力求达到“人机难辨”的AI交互效果。
原文链接
本文链接:https://kx.umi6.com/article/11908.html
转载请注明文章出处
相关推荐
.png)
换一换
豆包文科成绩超了一本线,为什么理科不行?
2024-07-02 14:30:06
用完这次更新的豆包 我想把PS卸了
2024-11-12 00:48:20
豆包实时语音大模型上线
2025-01-20 16:18:42
453 文章
90513 浏览
24小时热文
更多

-
2025-07-20 17:06:49
-
2025-07-20 16:05:44
-
2025-07-20 16:05:36