1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
B站开源自研 IndexTTS-2.0:情感可控、时长可控的零样本语音合成 AI 模型
9月8日,B站宣布开源自研语音生成模型IndexTTS-2.0,这是首个支持精确时长控制的自回归零样本TTS系统。该模型可实现精准音画同步,适合视频配音等场景,并支持两种生成模式:精确时长控制和自由生成保留韵律特征。其创新点包括情感与音色解耦,用户可独立指定音色和情绪来源,同时引入GPT潜在表示和三阶段训练策略,提升高情感表达下的语音清晰度。团队还通过“软指令”机制降低使用门槛,允许自然语言描述控制情绪。实验表明,IndexTTS-2.0在词错率、音色相似度和情绪保真度上超越现有模型。代码及预训练权重已公开,助力学术研究与产业应用。
DreamCoder
09-09 16:18:36
IndexTTS-2.0
情感与时长控制
零样本语音合成
分享至
打开微信扫一扫
内容投诉
生成图片
啊?7B的DeepSeek反超R1满血版,上海AI Lab周伯文团队新成果
标题:7B的DeepSeek反超R1满血版,上海AI Lab新成果 新方法使DeepSeek的Qwen数学能力超越R1满血版,7B模型反超671B。 上海AI Lab/清华哈工大/北邮团队的研究由齐弼卿和周伯文领导,探讨了Test-Time Scaling (TTS)在不同策略模型、过程奖励模型及问...
超频思维站
02-12 12:27:31
DeepSeek
TTS
数学模型
分享至
打开微信扫一扫
内容投诉
生成图片
巨人网络两款“游戏+AI”自研大模型应用首发
在2024年云栖大会上,巨人网络首次推出了两款自研大模型——GiantGPT和BaiLing-TTS。GiantGPT专为游戏领域设计,而BaiLing-TTS则具备行业领先的多普通话方言合成能力。此外,巨人网络还展示了其在AI技术领域的创新,包括巨人摹境和高精度实时交互数字人技术。此次发布标志着巨人网络在“游戏+AI”领域的积极探索与技术创新,展现出公司在数字化转型中的前瞻性和实力。
智能维度跳跃
09-19 11:30:48
BaiLing-TTS
GiantGPT
巨人网络
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序