12月15日,阿里通义发布两款‘百聆’语音模型升级版并开源。Fun-CosyVoice3支持3秒录音即可克隆音色,切换9种语言、18种方言及多种情感,首包延迟降低50%,中英混说准确率提升显著。Fun-ASR增强噪声场景识别率达93%,支持31种语言自由混说与歌词识别。两模型均支持本地部署与二次开发,适用于语音助手、直播配音等实时场景。开源地址已公布,供开发者体验与定制化微调。
原文链接
本文链接:https://kx.umi6.com/article/30250.html
转载请注明文章出处
相关推荐
换一换
几十个测试后,发现海螺语音与 ElevenLabs 掰手腕的能力不是盖的
2025-01-22 15:00:12
OpenAI 发布新一代语音模型,让 AI 智能体语音表达更自然
2025-03-21 12:18:48
阿里通义 Qwen3-TTS 家族上新两款 AI 模型:声音不仅能复制,还可以定制
2025-12-24 18:54:37
MiniMax登顶、多家创企融资,AI语音离「现实场景」还有多远?
2025-06-06 12:28:01
阿里开源 Qwen3 新模型 Embedding 及 Reranker,带来强大多语言、跨语言支持
2025-06-06 09:22:06
阶跃星辰语音模型登顶全球第一
2026-01-15 10:31:06
OpenAI推出语音模型全家桶:AI将说得更动情、听写更准确…
2025-03-21 11:23:36
OpenAI一口气发布三个新模型,还为此做了一个新网站
2025-03-21 08:08:53
OpenAI发布GPT-realtime语音对话模型
2025-08-29 08:37:51
OpenAI推出小型语音模型GPT-5 Pro
2025-10-07 03:44:27
阶跃星辰:旗下开源语音模型 Step-Audio-R1.1 在全球权威评测中登顶
2026-01-15 15:42:50
可生成 AI 播客:谷歌 NotebookLM 音频概览功能新增 76 种语言支持,包含中文
2025-04-30 19:45:39
微软 Copilot Voice AI 语音交互不再仅限英语,扩展支持德语、法语等语言
2025-02-06 10:30:55
672 文章
530148 浏览
24小时热文
更多
-
2026-04-24 18:31:29 -
2026-04-24 18:30:24 -
2026-04-24 18:29:17