1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

9月8日,B站宣布开源自研语音生成模型IndexTTS-2.0,这是首个支持精确时长控制的自回归零样本TTS系统。该模型可实现精准音画同步,适合视频配音等场景,并支持两种生成模式:精确时长控制和自由生成保留韵律特征。其创新点包括情感与音色解耦,用户可独立指定音色和情绪来源,同时引入GPT潜在表示和三阶段训练策略,提升高情感表达下的语音清晰度。团队还通过“软指令”机制降低使用门槛,允许自然语言描述控制情绪。实验表明,IndexTTS-2.0在词错率、音色相似度和情绪保真度上超越现有模型。代码及预训练权重已公开,助力学术研究与产业应用。

原文链接
本文链接:https://kx.umi6.com/article/24924.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
B站开源自研 IndexTTS-2.0:情感可控、时长可控的零样本语音合成 AI 模型
2025-09-09 16:18:36
B站开源IndexTTS-2.0:突破自回归TTS时长与情感控制瓶颈
2025-09-11 10:52:46
AI蛋白质优化与设计平台MoleculeOS完成重大代际升级 效率提升千亿倍
2026-02-06 16:01:32
10万Agent在Moltbook娱乐空谈,小冰之父出手造了个生产力实干版
2026-02-06 10:43:58
Claude一个插件吓哭华尔街,软件公司集体暴跌,2万亿元一日蒸发
2026-02-05 20:07:14
元宝AI生图功能日均调用增长30倍
2026-02-06 22:16:33
中国第一,全球第二,视频大模型领军者生数科技完成超 6 亿元A+轮融资
2026-02-06 17:02:51
中金:2026年大模型在强化学习、模型记忆、上下文工程等方面将取得更多突破
2026-02-05 08:39:59
天津:严禁使用AI开处方
2026-02-05 22:13:51
中东Robotaxi进入“千辆时代”,文远知行携手Uber刷新区域纪录
2026-02-06 17:01:39
美国联邦通信委员会受理SpaceX百万颗卫星系统部署申请
2026-02-05 13:54:00
全国最大国产AI算力池来了:部署超3万卡,上千款应用接入
2026-02-06 19:06:44
亚马逊盘前跌超9% 2000亿美元资本支出计划引发市场担忧
2026-02-06 17:07:18
24小时热文
更多
扫一扫体验小程序