OpenAI推出语音模型全家桶：AI将说得更动情、听写更准确…

2025-03-21 11:23:36

跨界思维

发布在

快讯

阅读：865

美东时间3月21日，OpenAI发布三款全新语音模型：GPT-4o Transcribe、GPT-4o MiniTranscribe和GPT-4o MiniTTS。GPT-4o MiniTTS能生成更逼真且可操控的语音，开发者可通过自然语言调整语气。新语音转文本模型GPT-4o Transcribe和GPT-4o MiniTranscribe在多语言支持和准确率上显著提升，尤其在英语、西班牙语中错误率低至2%，但在印度语和达罗毗荼语系中仍有约30%错误率。相比Whisper，新模型降低幻觉现象并更好适应复杂环境。OpenAI强调这些进展推动其“AI智能体”愿景，但新模型暂不公开发布，仅面向特定需求。

原文链接

本文链接：https://kx.umi6.com/article/15896.html

转载请注明文章出处

AI智能体