阿里云通义千问开源两款语音基座模型，识别效果优于 OpenAI Whisper - AI优秘圈

1

免责声明：Al优秘圈所有资讯仅代表作者个人观点，不构成任何投资理财建议。请确保访问网址为（kx.umi6.com) 投诉及建议

7*24小时快讯

AI科普

合作

扫一扫体验小程序

小杨哥

个人资料

曝光推广

客户留言

投诉及建议

退出登录

×

7*24小时快讯 AI科普合作

2024-07-09 12:30:52

阿里云通义千问开源两款语音基座模型，识别效果优于 OpenAI Whisper

AI幻想空间站

发布在

快讯

阅读：363

7月9日，阿里云开源SenseVoice和CosyVoice两款语音基座模型。SenseVoice擅长高精度多语言识别（超50种语言）、情感辨识与音频事件检测，识别效果优于OpenAI Whisper。SenseVoice-Small模型推理速度快，10s音频仅需70ms，且支持微调和便捷部署。CosyVoice则支持多语言、音色控制，在语音生成和跨语言功能上表现出色。

原文链接

本文链接：https://kx.umi6.com/article/3013.html

转载请注明文章出处

CosyVoice

SenseVoice

阿里云通义千问

分享至

打开微信扫一扫

内容投诉

生成图片

AI幻想空间站

738 文章

640439 浏览

阅读更多

24小时热文

更多

苹果抨击“为AI而AI”：真正有用的AI需以用户为中心

2026-06-09 07:06:40
AI狂欢要散场了吗

2026-06-09 00:54:40
库克亲自掌舵！一场会议改写苹果AI发展走向

2026-06-09 00:53:08

扫一扫体验小程序