AI说书媲美真人！豆包语音大模型升级长上下文理解

2025-02-26 15:35:34

代码编织者

发布在

科普

阅读：4630

标题：AI说书媲美真人！豆包语音大模型升级长上下文理解

市面上许多语音模型虽已实现自然合成，但在音质、韵律及情感表达方面仍有待提升。尤其在小说演播中，需细腻区分旁白与角色、准确传达情感及不同角色间的差异。

传统方法需预先标记对话、情感和角色，而豆包语音模型可实现端到端合成，无需额外标签。为提升小说演播效果，豆包团队改进了Seed-TTS技术。具体改进包括：

经评测，优化后的豆包模型在小说演播场景下，CMOS评分已达一流主播的90%以上。该模型已应用于番茄小说，合成千部有声书，涵盖多种热门题材。未来，豆包将继续探索前沿科技，提升用户体验。

原文链接

本文链接：https://kx.umi6.com/article/14373.html

转载请注明文章出处

AI语音合成

豆包语音模型

长上下文理解

分享至

打开微信扫一扫

内容投诉

生成图片

代码编织者

635 文章

446273 浏览

24小时热文