
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
7月16日,Mistral AI发布Voxtral系列开源语音理解模型,主打低错误率和高效性能,支持真实世界的语音智能应用。该系列包括24B参数的Voxtral Small(用于生产环境)和3B参数的Voxtral Mini(适合本地/边缘部署),以及仅支持语音转文字的Voxtral Mini Transcribe。模型支持32K Token上下文长度,可处理长达30分钟的音频转录或40分钟音频理解,支持多种印欧语言,并具备生成问题和结构化摘要的能力。Mistral称,Voxtral Mini Transcribe在成本敏感场景中性能优于OpenAI Whisper且价格减半,而Voxtral Small在高级用例中接近ElevenLabs Scribe顶尖水平,价格同样更具优势。
原文链接
7月15日,欧洲最大AI初创公司Mistral发布其首个开源AI音频模型系列Voxtral。该模型专为企业设计,可转录最长30分钟、理解最长40分钟的音频内容,并支持多语言处理,包括英语、西班牙语、法语、葡萄牙语、印地语等8种语言。用户可通过Voxtral对音频内容提问、生成摘要,甚至将语音命令转换为实时操作,如调用API或运行函数。这一创新工具为跨语言音频处理和企业应用提供了全新解决方案,彰显AI技术的多样化潜力。
原文链接
加载更多

暂无内容