1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

OpenAI发布三款新音频模型,涵盖语音转文本和文本转语音功能,助力开发者打造高效语音应用。

新模型的核心亮点包括: - gpt-4o-transcribe:大幅降低单词错误率(WER),在多语言基准测试中优于Whisper。 - gpt-4o-mini-transcribe:基于GPT-4o-mini架构,速度更快,适合资源受限场景。 - gpt-4o-mini-tts:支持“可引导性”,开发者可控制语音风格,定价每分钟0.015美元。

gpt-4o-transcribe采用多样化音频数据集训练,提高转录可靠性,适用于复杂场景如呼叫中心和会议记录。定价与Whisper相同,每分钟0.006美元。

gpt-4o-mini-tts通过强化学习提升转录精度,支持多种语音风格,增强用户体验。此外,OpenAI推出语音流式处理、降噪及语义语音检测等功能,简化开发流程。

新模型已在全球开发者中开放,并提供演示网站OpenAI.fm,支持定制化音频生成。未来,语音领域的趋势正从单纯的功能性转向情感化交互,强调更自然的人机沟通。

原文链接
本文链接:https://kx.umi6.com/article/15875.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
微软宣布组建超级智能团队,自研 AI 模型摆脱对 OpenAI 的依赖
2025-11-06 23:18:30
OpenAI 被曝正开发全新 AI 大语言模型:代号“大蒜”,性能超越谷歌 Gemini 3
2025-12-03 00:43:57
汇丰银行:OpenAI 到 2030 年都难以盈利,同时还要再砸至少 2070 亿美元
2025-11-27 15:43:07
奥特曼谈OpenAI首款AI硬件:我想拿起它咬一口
2025-11-25 10:43:52
AI投资须政府兜底? OpenAI奥尔特曼紧急“灭火”:2030年营收达数千亿美元
2025-11-07 09:43:08
OpenAI 首席财务官莎拉・弗里尔:公司目前暂无 IPO 计划,正推动公司稳步提升现有规模
2025-11-06 08:47:48
每本书最高赔 15 万美元:OpenAI 涉嫌“恶意侵权”恐面临天价罚款
2025-12-03 12:16:14
Transformer作者爆料GPT-5.1内幕!OpenAI内部命名规则变乱了
2025-11-30 14:13:24
耗电量将相当于整个印度,OpenAI 计划 2033 年前建成 250 吉瓦 AI 数据中心
2025-11-14 17:07:23
微软成立MAI超级智能团队:推进AI自主化摆脱对OpenAI依赖
2025-11-07 18:03:07
OpenAI 推出教育版 ChatGPT,2027 年 6 月前对美国 K - 12 教师免费
2025-11-20 21:42:05
OpenAI 在德国吃官司:ChatGPT 未经许可使用歌词属于侵权行为
2025-11-11 18:22:32
AI没有航天香?前红杉资本掌舵人称:SpaceX比OpenAI更值钱
2025-11-19 17:29:38
24小时热文
更多
扫一扫体验小程序