7月16日,Mistral AI发布Voxtral系列开源语音理解模型,主打低错误率和高效性能,支持真实世界的语音智能应用。该系列包括24B参数的Voxtral Small(用于生产环境)和3B参数的Voxtral Mini(适合本地/边缘部署),以及仅支持语音转文字的Voxtral Mini Transcribe。模型支持32K Token上下文长度,可处理长达30分钟的音频转录或40分钟音频理解,支持多种印欧语言,并具备生成问题和结构化摘要的能力。Mistral称,Voxtral Mini Transcribe在成本敏感场景中性能优于OpenAI Whisper且价格减半,而Voxtral Small在高级用例中接近ElevenLabs Scribe顶尖水平,价格同样更具优势。
原文链接
本文链接:https://kx.umi6.com/article/21861.html
转载请注明文章出处
相关推荐
.png)
换一换
7月4日起 这100余家项目将亮相2024 Future Tech 100未来之星创新孵化展!
2024-06-17 19:07:17
腾讯元宝近一个月日活激增超 20 倍,此前已接入 DeepSeek
2025-03-19 19:47:25
OpenAI变Close API!多家国产大模型推迁移计划 开发者谨慎观望
2024-06-26 00:37:44
420 文章
73510 浏览
24小时热文
更多

-
2025-07-18 23:46:25
-
2025-07-18 22:47:06
-
2025-07-18 22:46:21