7月9日,阿里云开源SenseVoice和CosyVoice两款语音基座模型。SenseVoice擅长高精度多语言识别(超50种语言)、情感辨识与音频事件检测,识别效果优于OpenAI Whisper。SenseVoice-Small模型推理速度快,10s音频仅需70ms,且支持微调和便捷部署。CosyVoice则支持多语言、音色控制,在语音生成和跨语言功能上表现出色。
原文链接
本文链接:https://kx.umi6.com/article/3013.html
转载请注明文章出处
相关推荐
换一换
阿里云通义千问 Qwen Code 宣布每日可免费运行 2000 次:仅限中国大陆用户,一行命令即可安装
2025-08-09 23:38:03
阿里音频生成大模型一次发俩还开源!50种语言快速理解+5种语言语音生成,带情感的那种
2024-07-07 14:10:28
阿里云通义千问开源两款语音基座模型,识别效果优于 OpenAI Whisper
2024-07-09 12:30:52
OpenAI合作伙伴Crusoe在新一轮融资中估值达100亿美元
2025-10-24 03:21:23
阿里回应“C计划”爆料 夸克上线对话助手挑战豆包 AI App下一步如何进化?
2025-10-23 14:06:33
全球首个百亿级可部署基因组基础模型诞生
2025-10-23 07:59:17
Claude 看齐 ChatGPT 新增 AI 自动记忆,能记住你的每一次对话
2025-10-24 09:31:18
马斯克详谈AI5芯片:由三星和台积电一起生产,不会弃用英伟达GPU!
2025-10-23 10:06:47
KTransformers入选计算机系统顶会、与主流框架合作,趋境&清华让「异构」成为推理新范式
2025-10-23 10:01:08
1.3亿美元!LiblibAI拿下国内AI应用赛道年度最大融资
2025-10-23 15:06:43
字节跳动 Seed3D 1.0 发布:一张图就能生成高精度 3D 模型
2025-10-23 14:05:22
自动驾驶,走出青春期
2025-10-23 15:09:02
OpenAI:欧洲业务增长强劲 将继续加大投入
2025-10-24 00:18:56
570 文章
274135 浏览
24小时热文
更多
-
2025-10-24 09:34:47 -
2025-10-24 09:33:43 -
2025-10-24 09:32:35