1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

OpenAI发布三款新音频模型,涵盖语音转文本和文本转语音功能,助力开发者打造高效语音应用。

新模型的核心亮点包括: - gpt-4o-transcribe:大幅降低单词错误率(WER),在多语言基准测试中优于Whisper。 - gpt-4o-mini-transcribe:基于GPT-4o-mini架构,速度更快,适合资源受限场景。 - gpt-4o-mini-tts:支持“可引导性”,开发者可控制语音风格,定价每分钟0.015美元。

gpt-4o-transcribe采用多样化音频数据集训练,提高转录可靠性,适用于复杂场景如呼叫中心和会议记录。定价与Whisper相同,每分钟0.006美元。

gpt-4o-mini-tts通过强化学习提升转录精度,支持多种语音风格,增强用户体验。此外,OpenAI推出语音流式处理、降噪及语义语音检测等功能,简化开发流程。

新模型已在全球开发者中开放,并提供演示网站OpenAI.fm,支持定制化音频生成。未来,语音领域的趋势正从单纯的功能性转向情感化交互,强调更自然的人机沟通。

原文链接
本文链接:https://kx.umi6.com/article/15875.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
OpenAI调整“星际之门”项目策略:暂缓自建 转向与甲骨文及软银深度合作
2026-02-24 13:54:26
知道你一切隐私的AI 现在着急卖广告赚钱了
2026-02-13 23:46:20
OpenAI 与盖茨基金会将向非洲投资 5000 万美元,利用 AI 改善医疗体系
2026-01-21 15:16:32
OpenAI发布Windows版Codex应用
2026-03-05 10:04:49
GPT-5.3上线Codex!OpenAI回应Claude新模型只用了15分钟
2026-02-06 11:46:30
ChatGPT强行上马广告,因为OpenAI真的很烧钱
2026-01-19 16:01:57
14亿元留不住!庞若鸣弃Meta加盟OpenAI
2026-02-26 13:58:39
黄仁勋否认对OpenAI不满 透露将巨额投资
2026-02-01 19:56:16
黄仁勋反悔,不投千亿美元给OpenAI了?
2026-02-03 02:13:44
没博士没论文,这些人杀进AI大厂
2026-01-27 03:49:22
OpenAI正敲定1000亿美元巨额融资轮的首批投资承诺
2026-02-19 11:19:20
OpenAI、谷歌员工以公开信反对五角大楼“技术收编”
2026-02-27 20:09:52
OpenAI与AWS达成协议 以竞标美国政府合同
2026-03-17 22:15:04
24小时热文
更多
扫一扫体验小程序