1月20日,豆包实时语音大模型正式发布,旨在实现端到端语音对话,主要面向中文语境。该模型具备接近真人的语音表达水准,低时延且支持打断对话。在与OpenAI的GPT-4o对比中,豆包模型在语音语气自然度和情绪饱满度方面表现更优,整体满意度评分4.36(满分5分)。豆包模型团队采用端到端框架,融合语音与文本模态,通过预训练和后训练阶段优化,提升了模型的对话能力和安全性。实时语音AI的价值在于提供更真实的交互体验和情感价值,有望推动AI端侧硬件的发展。
原文链接
本文链接:https://kx.umi6.com/article/11909.html
转载请注明文章出处
相关推荐
换一换
安卓版 Perplexity Assistant 登场:AI 多模态交互,“看”懂你的世界
2025-01-24 11:40:29
千里科技联手阶跃星辰、吉利发布下一代智能座舱Agent OS
2025-07-26 22:46:46
OpenAI ChatGPT 优化多模态交互,AI 聊天合并支持语音与文本
2025-11-26 08:30:01
MiniMax在海外的AI陪聊产品,爆了
2024-06-07 21:42:24
您的“赛博朋友”到了,请查收。
2025-01-13 19:57:36
最大的AI情感陪伴需求,居然在农村?
2025-03-16 16:57:23
“擦边”营销、诱导消费,赛博恋爱是门好生意吗?
2025-03-21 13:21:19
AI女友正在变成马斯克的印钞机
2025-07-20 19:07:11
珞博智能完成数千万元天使轮融资,上影新视野基金、金沙江创投联合领投
2025-06-17 18:26:46
300多个APP,想让我和AI谈感情
2025-10-17 17:25:40
系统级AI的“微观竞争”,OPPO选择从底层到交互重构ColorOS
2024-10-21 10:21:38
您的“赛博朋友”到了,请查收
2025-01-16 10:50:15
阿里云发布 AI 硬件多模态交互开发套件:集成通义大模型,适配 30 多款终端芯片
2026-01-08 13:12:06
737 文章
672558 浏览
24小时热文
更多
-
2026-06-09 00:54:40 -
2026-06-09 00:53:08 -
2026-06-08 23:49:41