1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

9月8日,B站宣布开源自研语音生成模型IndexTTS-2.0,这是首个支持精确时长控制的自回归零样本TTS系统。该模型可实现精准音画同步,适合视频配音等场景,并支持两种生成模式:精确时长控制和自由生成保留韵律特征。其创新点包括情感与音色解耦,用户可独立指定音色和情绪来源,同时引入GPT潜在表示和三阶段训练策略,提升高情感表达下的语音清晰度。团队还通过“软指令”机制降低使用门槛,允许自然语言描述控制情绪。实验表明,IndexTTS-2.0在词错率、音色相似度和情绪保真度上超越现有模型。代码及预训练权重已公开,助力学术研究与产业应用。

原文链接
本文链接:https://kx.umi6.com/article/24924.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
B站开源自研 IndexTTS-2.0:情感可控、时长可控的零样本语音合成 AI 模型
2025-09-09 16:18:36
全球首款“边走边讲边演示”人形机器人:魔法原子发布智慧导览解决方案
2025-09-09 21:23:51
“AI 教父”辛顿自曝:前女友在分手时曾用 ChatGPT 来指责他
2025-09-08 18:01:47
工信部:将研究出台人工智能+制造专项行动实施方案
2025-09-09 11:14:37
AI热潮隐忧浮现?高盛:AI投资持续加速 但企业采用势头放缓
2025-09-09 10:11:49
百度股价创今年新高!李彦宏700万元重奖技术团队
2025-09-08 20:03:26
Canalys:二季度全球云基础设施服务支出达953亿美元 同比增长22%
2025-09-09 12:14:24
上海:给予最高不超过1200万元支持AI+数字广告智能体研发
2025-09-08 11:59:20
谷歌nano banana成功后,OpenAI花11亿买了一家公司
2025-09-08 18:02:57
京东云计算入股具身智能机器人公司千寻智能
2025-09-08 12:58:45
工信部:推动体育器械与人工智能、虚拟现实等新技术融合创新
2025-09-09 17:18:09
AI终局之战:美国目前赢了技术,但中国会赢下未来?
2025-09-09 16:19:36
腾讯发布AI CLI工具CodeBuddy Code
2025-09-09 14:24:09
24小时热文
更多
扫一扫体验小程序