阿里通义实验室发布开源语音大模型FunAudioLLM,包含SenseVoice和CosyVoice两个部分。SenseVoice专长于多语言高精度识别、情感辨识和音频事件检测,对50+语言有优异表现,特别是中文和粤语提升显著;CosyVoice则擅长自然语音生成,支持5种语言,能快速生成带情感的语音,只需少量音频输入。FunAudioLLM可用于语音翻译、情感对话、互动播客和有声读物等,通过无缝语音翻译保留情感色彩,实现情感丰富的交互体验。模型已在GitHub上开源,提供了丰富的应用场景和实例。
原文链接
本文链接:https://kx.umi6.com/article/2909.html
转载请注明文章出处
相关推荐
换一换
阿里云通义千问开源两款语音基座模型,识别效果优于 OpenAI Whisper
2024-07-09 12:30:52
阿里云通义千问开源两款语音基座模型,识别效果优于 OpenAI Whisper
2024-07-09 12:30:52
CVPR 2026完美落幕!D4RT封神最佳论文、牛津VGG两连冠,中国本科生泰坦显卡逆袭引爆全网
2026-06-08 16:37:30
全方位AI超进化!华硕 COMPUTEX 2026 开启企业至边缘 AI 转型新篇章
2026-06-05 12:56:42
世界模型榜首易主!跨维智能登顶WorldArena
2026-06-03 19:33:11
智源&清华合作成果登上Science:脑科学多模态基础模型Brainμ支撑揭示“记忆-睡眠”调控的神经机制
2026-06-05 19:13:44
刚刚,姚顺雨现身!公开回应腾讯AI落后了吗?
2026-06-05 12:54:51
CVPR 2026 几何智能研究盘点:从看见形状,到理解运动与交互
2026-06-08 11:25:46
AI Agent的门票 MiniMax想先打下来
2026-06-04 17:17:31
AI“吹大”的美股泡沫有多大?高盛:确有过热 但未至历史极端水平
2026-06-08 16:35:40
刚刚,李飞飞亲自下场定义世界模型
2026-06-04 09:56:31
慕尼黑工大Johannes Betz 教授:时速300公里的自动驾驶超车 | ICRA 2026
2026-06-04 16:14:04
教你用AI一节课收17万,华尔街精英排着队付费
2026-06-07 11:28:34
765 文章
651546 浏览
24小时热文
更多
-
2026-06-09 07:06:40 -
2026-06-09 00:54:40 -
2026-06-09 00:53:08