12月15日,阿里通义发布两款‘百聆’语音模型升级版并开源。Fun-CosyVoice3支持3秒录音即可克隆音色,切换9种语言、18种方言及多种情感,首包延迟降低50%,中英混说准确率提升显著。Fun-ASR增强噪声场景识别率达93%,支持31种语言自由混说与歌词识别。两模型均支持本地部署与二次开发,适用于语音助手、直播配音等实时场景。开源地址已公布,供开发者体验与定制化微调。
原文链接
本文链接:https://kx.umi6.com/article/30250.html
转载请注明文章出处
相关推荐
换一换
阿里通义百聆推出语音模型新版本:3 秒录音即可“复制”9 种语言、18 种方言
2025-12-15 16:47:57
几十个测试后,发现海螺语音与 ElevenLabs 掰手腕的能力不是盖的
2025-01-22 15:00:12
阶跃星辰:旗下开源语音模型 Step-Audio-R1.1 在全球权威评测中登顶
2026-01-15 15:42:50
OpenAI一口气发布三个新模型,还为此做了一个新网站
2025-03-21 08:08:53
OpenAI发布GPT-realtime语音对话模型
2025-08-29 08:37:51
阿里通义 Qwen3-TTS 家族上新两款 AI 模型:声音不仅能复制,还可以定制
2025-12-24 18:54:37
突发!微软与OpenAI同日开火:语音之战+通用大模型,AI霸权决战打响
2025-08-30 11:49:23
小米开源首个原生端到端语音大模型
2025-09-19 10:10:03
OpenAI 发布新一代语音模型,让 AI 智能体语音表达更自然
2025-03-21 12:18:48
MiniMax登顶、多家创企融资,AI语音离「现实场景」还有多远?
2025-06-06 12:28:01
阶跃星辰语音模型登顶全球第一
2026-01-15 10:31:06
可生成 AI 播客:谷歌 NotebookLM 音频概览功能新增 76 种语言支持,包含中文
2025-04-30 19:45:39
OpenAI推出语音模型全家桶:AI将说得更动情、听写更准确…
2025-03-21 11:23:36
646 文章
457599 浏览
24小时热文
更多
-
2026-03-09 21:13:27 -
2026-03-09 20:09:26 -
2026-03-09 20:09:18