OpenAI发布三款新音频模型,涵盖语音转文本和文本转语音功能,助力开发者打造高效语音应用。
新模型的核心亮点包括: - gpt-4o-transcribe:大幅降低单词错误率(WER),在多语言基准测试中优于Whisper。 - gpt-4o-mini-transcribe:基于GPT-4o-mini架构,速度更快,适合资源受限场景。 - gpt-4o-mini-tts:支持“可引导性”,开发者可控制语音风格,定价每分钟0.015美元。
gpt-4o-transcribe采用多样化音频数据集训练,提高转录可靠性,适用于复杂场景如呼叫中心和会议记录。定价与Whisper相同,每分钟0.006美元。
gpt-4o-mini-tts通过强化学习提升转录精度,支持多种语音风格,增强用户体验。此外,OpenAI推出语音流式处理、降噪及语义语音检测等功能,简化开发流程。
新模型已在全球开发者中开放,并提供演示网站OpenAI.fm,支持定制化音频生成。未来,语音领域的趋势正从单纯的功能性转向情感化交互,强调更自然的人机沟通。
原文链接
本文链接:https://kx.umi6.com/article/15875.html
转载请注明文章出处
相关推荐
.png)
换一换
OpenAI与Anthropic树立典范!AI老对手间开始“互测”模型安全性
2025-08-28 11:23:27
OPENAI推出更强大的GPT-5模型 适用于编码和写作
2025-08-08 02:01:55
OpenAI、Anthropic 互评对方 AI 模型:GPT 存在谄媚行为,Claude 不易产生幻觉
2025-08-28 10:18:59
GPT-5发布了,到底有没有那么神?
2025-08-08 09:10:02
OpenAI 以 1 美元价格向美国政府提供 ChatGPT 企业版服务
2025-08-07 09:46:18
OpenAI官宣直播活动
2025-08-07 08:50:44
天才少年背刺马斯克,疑窃取代码“叛逃”OpenAI?
2025-09-01 12:16:43
超 98% 参赛者:OpenAI 神秘 AI 模型首次斩获信息学奥赛 IOI 2025 金牌
2025-08-12 11:19:59
5000 亿美元估值傲视群雄,OpenAI 员工拟出售价值近 60 亿美元股份
2025-08-16 14:25:24
GPT-5测试被质疑作弊,故意避开难题刷高分?
2025-08-12 12:18:06
估值直逼5000亿美元!OpenAI洽谈新一轮员工股权出售
2025-08-06 15:40:49
OpenAI 推出两款开源模型 gpt-oss-120b / 20b,性能逼近 o4-mini/o3-mini
2025-08-06 08:23:05
奥特曼给ChatGPT空降高管,11亿美元收购独角兽创始人加入OpenAI…好熟悉的剧情
2025-09-04 08:57:38
486 文章
157407 浏览
24小时热文
更多

-
2025-09-06 20:38:03
-
2025-09-06 19:37:51
-
2025-09-06 16:37:17