1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

9月8日,B站宣布开源自研语音生成模型IndexTTS-2.0,这是首个支持精确时长控制的自回归零样本TTS系统。该模型可实现精准音画同步,适合视频配音等场景,并支持两种生成模式:精确时长控制和自由生成保留韵律特征。其创新点包括情感与音色解耦,用户可独立指定音色和情绪来源,同时引入GPT潜在表示和三阶段训练策略,提升高情感表达下的语音清晰度。团队还通过“软指令”机制降低使用门槛,允许自然语言描述控制情绪。实验表明,IndexTTS-2.0在词错率、音色相似度和情绪保真度上超越现有模型。代码及预训练权重已公开,助力学术研究与产业应用。

原文链接
本文链接:https://kx.umi6.com/article/24924.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
B站开源自研 IndexTTS-2.0:情感可控、时长可控的零样本语音合成 AI 模型
2025-09-09 16:18:36
B站开源IndexTTS-2.0:突破自回归TTS时长与情感控制瓶颈
2025-09-11 10:52:46
国家数据局局长刘烈宏:今年3月中国日均Token调用量已突破140万亿 两年增长超千倍
2026-03-23 18:37:57
老外担心中国大模型也学OpenAI闭源 智谱回应:别慌 会继续开源
2026-03-21 12:05:31
国家数据局局长刘烈宏:第九届数字中国建设峰会首展率超过65%
2026-03-24 10:42:03
马斯克:“Terafab”项目将落户奥斯汀 由特斯拉和SpaceX共同运营
2026-03-22 13:48:04
国家级电力人工智能中试基地迎首批企业 华为、中兴、百度等入驻
2026-03-21 15:21:36
阿里在海外上了个“企业级龙虾”,我用它30分钟手搓了一家网店
2026-03-24 13:50:56
机构:预估2026年智能手机平均存储容量年增4.8%
2026-03-23 14:21:40
西门子与阿里巴巴深化合作 推动先进工业仿真能力上云
2026-03-23 17:34:11
OpenAI要求谷歌将ChatGPT列为默认搜索引擎之一
2026-03-23 20:45:43
全国首只AIC产业并购基金揭牌 聚焦集成电路装备
2026-03-23 21:52:27
寒武纪盘中跌超2% 失守1000元大关
2026-03-23 11:11:18
24小时热文
更多
扫一扫体验小程序