标题:语音界Deepseek!百度最新跨模态端到端语音交互,成本最高降90%
百度推出行业首个基于Cross-Attention的端到端语音语言大模型,大幅提升语音交互的真实性和情感表达,同时大幅降低语音问答场景的调用成本,最高降幅达90%。
该模型通过创新的跨模态架构,将语音识别和语言模型深度融合,显著减少KV cache计算,提升推理效率。具体创新包括:基于Cross-Attention的高效全查询注意力技术(EALLQA),大幅降低计算复杂度;Encoder与语音识别系统融合,减少KV计算;Decoder与语音合成模型结合,实现自然流畅的情感表达。
此外,该模型支持流式逐字合成,字节级输出确保语音合成更贴近人类发音习惯,同时提升交互响应速度。在情感控制方面,该模型可覆盖17种情绪,大幅提升语音交互的真实感。
百度语音首席架构师贾磊强调,这项技术不仅在性能上取得突破,更大幅降低了工业级应用的成本门槛。未来,百度希望将这一技术分享给行业,推动语音技术的广泛应用。
目前,该模型已在L20卡上实现部署,双卡并发支持数百以上语音交互任务。这一成果标志着百度在语音交互领域迈出了重要一步,也为大模型在更多应用场景的普及奠定了基础。
原文链接
本文链接:https://kx.umi6.com/article/16641.html
转载请注明文章出处
相关推荐
.png)
换一换
文心大模型4.5Turbo发布
2025-04-25 10:05:49
百度Al智能体心响App上线
2025-04-22 17:26:35
曝国行版苹果AI渐近 阿里百度提供支持但分工不尽相同
2025-05-06 16:56:27
百度PC端首页上线DeepSeek入口 开放仅1小时超千万人使用
2025-02-21 14:58:58
百度要做AI版富士康?
2024-12-11 18:32:31
AI时代,百度的三大主义
2024-11-14 14:14:51
一手实测文心X1/4.5:又强又全面!歪果网友疯求英文版
2025-03-17 13:38:09
百度生成式AI和大模型专利中国第一,全栈创新驱动AI应用领先
2025-07-18 16:41:37
云拉了百度一把
2025-02-19 21:57:53
国内首个:百度成功点亮昆仑芯三代万卡集群,还将点亮 3 万卡集群
2025-02-05 11:00:31
百度决定背叛闭源大模型,李彦宏重新拥抱开源
2025-02-14 12:33:30
李彦宏:百度将于 2025 年初发布新版文心大模型
2024-11-21 22:44:24
百度英伟达共同发起“2024 百度搜索・文心智能体创新大赛”,总奖金近 50 万元
2024-08-30 00:11:00
527 文章
174396 浏览
24小时热文
更多

-
2025-09-06 20:38:03
-
2025-09-06 19:37:51
-
2025-09-06 16:37:17