1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

美东时间3月21日,OpenAI发布三款全新语音模型:GPT-4o Transcribe、GPT-4o MiniTranscribe和GPT-4o MiniTTS。GPT-4o MiniTTS能生成更逼真且可操控的语音,开发者可通过自然语言调整语气。新语音转文本模型GPT-4o Transcribe和GPT-4o MiniTranscribe在多语言支持和准确率上显著提升,尤其在英语、西班牙语中错误率低至2%,但在印度语和达罗毗荼语系中仍有约30%错误率。相比Whisper,新模型降低幻觉现象并更好适应复杂环境。OpenAI强调这些进展推动其“AI智能体”愿景,但新模型暂不公开发布,仅面向特定需求。

原文链接
本文链接:https://kx.umi6.com/article/15896.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
OpenAI的「独立战争」
2025-07-05 11:58:16
OpenAI反挖四位特斯拉、xAI、Meta高级工程师
2025-07-09 13:06:54
Manus 回应裁员传闻:自身经营效率考量,调整部分业务团队
2025-07-08 23:54:12
24小时热文
更多
扫一扫体验小程序