1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

阿里通义实验室发布开源语音大模型FunAudioLLM,包含SenseVoice和CosyVoice两个部分。SenseVoice专长于多语言高精度识别、情感辨识和音频事件检测,对50+语言有优异表现,特别是中文和粤语提升显著;CosyVoice则擅长自然语音生成,支持5种语言,能快速生成带情感的语音,只需少量音频输入。FunAudioLLM可用于语音翻译、情感对话、互动播客和有声读物等,通过无缝语音翻译保留情感色彩,实现情感丰富的交互体验。模型已在GitHub上开源,提供了丰富的应用场景和实例。

原文链接
本文链接:https://kx.umi6.com/article/2909.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
阿里云通义千问开源两款语音基座模型,识别效果优于 OpenAI Whisper
2024-07-09 12:30:52
阿里音频生成大模型一次发俩还开源!50种语言快速理解+5种语言语音生成,带情感的那种
2024-07-07 14:10:28
上海新增2款已完成备案的生成式人工智能服务
2025-10-23 19:13:44
Anthropic确认与谷歌云达成价值数百亿美元的合作协议
2025-10-24 05:23:38
阿里巴巴将开启夸克AI眼镜预售 推动人工智能应用商业化
2025-10-23 13:08:00
2025豫台经贸洽谈会开幕 签约近300亿元合作项目
2025-10-24 13:37:40
马斯克:特斯拉 Optimus 机器人将成为“令人难以置信的外科医生”
2025-10-24 11:34:35
沐曦集成科创板IPO上会在即 十余家上市公司互动易回复参股投资
2025-10-23 21:15:29
Mobileye连续三个季度营收同比增长,EyeQ芯片出货量持续增长
2025-10-24 11:32:17
全国人大常委会法工委:网络安全法拟增加促进AI安全与发展内容
2025-10-23 18:13:26
慧思开物SDK正式开放 北京人形加速构建具身智能生态新格局
2025-10-23 15:11:25
95后小伙手搓AI眼镜:盲道、红绿灯都可认出 成本仅百元
2025-10-24 12:39:22
AI在线强化学习“边做边学”,斯坦福团队让7B小模型性能飙升,甚至超越GPT-4o
2025-10-24 12:36:00
24小时热文
更多
扫一扫体验小程序