1月20日,豆包实时语音大模型正式发布,旨在实现端到端语音对话,主要面向中文语境。该模型具备接近真人的语音表达水准,低时延且支持打断对话。在与OpenAI的GPT-4o对比中,豆包模型在语音语气自然度和情绪饱满度方面表现更优,整体满意度评分4.36(满分5分)。豆包模型团队采用端到端框架,融合语音与文本模态,通过预训练和后训练阶段优化,提升了模型的对话能力和安全性。实时语音AI的价值在于提供更真实的交互体验和情感价值,有望推动AI端侧硬件的发展。
原文链接
本文链接:https://kx.umi6.com/article/11909.html
转载请注明文章出处
相关推荐
.png)
换一换
年轻人的好友列表 AI越来越多
2024-10-22 18:10:08
西湖心辰即将发布语音大模型“心辰Lingo” AI情感陪伴赛道仍步履维艰
2024-08-12 16:28:33
讯飞星火多模态交互大模型上线,数字人、语音、视觉支持一键调用
2024-11-14 19:24:41
443 文章
76999 浏览
24小时热文
更多

-
2025-07-19 17:56:25
-
2025-07-19 17:55:01
-
2025-07-19 16:54:40