1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:语音界Deepseek!百度最新跨模态端到端语音交互,成本最高降90%

百度推出行业首个基于Cross-Attention的端到端语音语言大模型,大幅提升语音交互的真实性和情感表达,同时大幅降低语音问答场景的调用成本,最高降幅达90%。

该模型通过创新的跨模态架构,将语音识别和语言模型深度融合,显著减少KV cache计算,提升推理效率。具体创新包括:基于Cross-Attention的高效全查询注意力技术(EALLQA),大幅降低计算复杂度;Encoder与语音识别系统融合,减少KV计算;Decoder与语音合成模型结合,实现自然流畅的情感表达。

此外,该模型支持流式逐字合成,字节级输出确保语音合成更贴近人类发音习惯,同时提升交互响应速度。在情感控制方面,该模型可覆盖17种情绪,大幅提升语音交互的真实感。

百度语音首席架构师贾磊强调,这项技术不仅在性能上取得突破,更大幅降低了工业级应用的成本门槛。未来,百度希望将这一技术分享给行业,推动语音技术的广泛应用。

目前,该模型已在L20卡上实现部署,双卡并发支持数百以上语音交互任务。这一成果标志着百度在语音交互领域迈出了重要一步,也为大模型在更多应用场景的普及奠定了基础。

原文链接
本文链接:https://kx.umi6.com/article/16641.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
直面 OpenAI,Anthropic 正筹备“最快本月”推出语音交互功能
2025-04-16 07:56:17
百度Q1总营收321亿 AI业务收入占比达52%
2026-05-18 17:50:52
李彦宏:百度下一代旗舰大模型研发中 会在准备就绪后尽快发布
2025-08-20 21:19:28
百度推出外贸企业AI扶持计划
2025-04-12 18:58:26
缩水43%!百度152亿收购YY直播,四年纷争迎终局?
2025-02-26 07:20:19
百度:推出首个多模态高度融合数字人
2025-06-17 16:25:35
百度正式开源文心大模型 4.5 系列模型
2025-06-30 11:41:55
百度旗下基金等入股简智新创机器人公司
2025-08-20 16:23:44
倒计时两周!百度“文心杯”创业大赛亿元奖金池等你来冲
2025-05-06 17:54:39
百度端到端语音语言大模型发布,成本宣称最高降 90%
2025-03-31 17:43:30
百度反思!李彦宏承认不是所有的game百度都能玩赢
2025-07-09 16:07:25
百度市盈率都不到10倍了?
2025-04-25 22:24:59
国行版iPhone AI来了!百度、阿里技术支持但分工不同
2025-05-06 19:00:19
24小时热文
更多
扫一扫体验小程序