综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2025年10月,火山引擎升级了豆包语音大模型,推出语音合成模型2.0与声音复刻模型2.0。新模型通过深度语义理解与上下文推理能力,使AI语音从“像人”走向“懂人”,支持情感表达、方言、语气等多样化控制。例如,郭德纲和于谦的腔调被复刻演绎“发疯文学”。此外,新架构还解决了复杂公式朗读难题,准确率达90%。同时,豆包大模型1.6新增分档调节思考长度功能,并推出轻量化版本及智能模型路由技术,显著降低企业使用成本。目前,该技术已在小米、懂车帝等企业落地应用,日均tokens调用量超过30万亿,占据中国公有云市场半壁江山。
原文链接
标题:AI说书媲美真人!豆包语音大模型升级长上下文理解
市面上许多语音模型虽已实现自然合成,但在音质、韵律及情感表达方面仍有待提升。尤其在小说演播中,需细腻区分旁白与角色、准确传达情感及不同角色间的差异。
传统方法需预先标记对话、情感和角色,而豆包语音模型可实现端到端合成,无需额外标签。为提升小说演...
原文链接
加载更多
暂无内容