阿里通义实验室发布开源语音大模型FunAudioLLM,包含SenseVoice和CosyVoice两个部分。SenseVoice专长于多语言高精度识别、情感辨识和音频事件检测,对50+语言有优异表现,特别是中文和粤语提升显著;CosyVoice则擅长自然语音生成,支持5种语言,能快速生成带情感的语音,只需少量音频输入。FunAudioLLM可用于语音翻译、情感对话、互动播客和有声读物等,通过无缝语音翻译保留情感色彩,实现情感丰富的交互体验。模型已在GitHub上开源,提供了丰富的应用场景和实例。
原文链接
本文链接:https://kx.umi6.com/article/2909.html
转载请注明文章出处
相关推荐
换一换
阿里音频生成大模型一次发俩还开源!50种语言快速理解+5种语言语音生成,带情感的那种
2024-07-07 14:10:28
阿里云通义千问开源两款语音基座模型,识别效果优于 OpenAI Whisper
2024-07-09 12:30:52
农业农村部:将持续推动人工智能等在农业领域应用
2026-01-22 11:51:14
英伟达黄仁勋:AI机器人是欧洲难得机遇
2026-01-22 08:44:42
Mobileye势头强劲,2025财年全年营收同比增长15%
2026-01-23 11:47:43
昇腾云客户2663家,华为云稳居最大国产AI云服务提供商
2026-01-22 17:01:32
上海市新增8款已完成登记的生成式人工智能服务
2026-01-23 15:02:58
过去一年,中国AI如何改变全球开源格局?
2026-01-22 13:56:28
最新调仓路径显现 基金经理关注确定性与安全边际
2026-01-22 07:43:21
AI推理GPU芯片公司曦望完成近30亿元融资
2026-01-22 16:05:02
腾讯重仓的GPU公司要上市了!燧原科技IPO获受理,拟募资60亿
2026-01-23 14:59:46
国家知识产权局:我国人工智能专利有效量居全球前列
2026-01-23 10:49:16
黄仁勋证实英伟达已取代苹果 成为台积电最大客户
2026-01-22 16:02:53
660 文章
412808 浏览
24小时热文
更多
-
2026-01-23 21:15:09 -
2026-01-23 21:14:01 -
2026-01-23 20:15:45