1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

OpenAI发布三款新音频模型,涵盖语音转文本和文本转语音功能,助力开发者打造高效语音应用。

新模型的核心亮点包括: - gpt-4o-transcribe:大幅降低单词错误率(WER),在多语言基准测试中优于Whisper。 - gpt-4o-mini-transcribe:基于GPT-4o-mini架构,速度更快,适合资源受限场景。 - gpt-4o-mini-tts:支持“可引导性”,开发者可控制语音风格,定价每分钟0.015美元。

gpt-4o-transcribe采用多样化音频数据集训练,提高转录可靠性,适用于复杂场景如呼叫中心和会议记录。定价与Whisper相同,每分钟0.006美元。

gpt-4o-mini-tts通过强化学习提升转录精度,支持多种语音风格,增强用户体验。此外,OpenAI推出语音流式处理、降噪及语义语音检测等功能,简化开发流程。

新模型已在全球开发者中开放,并提供演示网站OpenAI.fm,支持定制化音频生成。未来,语音领域的趋势正从单纯的功能性转向情感化交互,强调更自然的人机沟通。

原文链接
本文链接:https://kx.umi6.com/article/15875.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
郭明錤:OpenAI进军手机 正与联发科、高通合作开发处理器
2026-04-27 12:10:29
OpenAI推出药物研发AI模型 挑战谷歌
2026-04-17 05:42:36
OpenAI发布Images 2 获机构Arena.ai测评第一
2026-04-22 16:21:00
Ilya曝光70页OpenAI绝密文件
2026-04-07 10:47:37
OpenAI与美国军方合作引发用户反对:ChatGPT卸载量增加295% 一星评价激增775%
2026-03-03 11:59:16
报告:Anthropic企业采用率首超OpenAI
2026-05-14 13:40:50
OpenAI回应TanStack供应链攻击:未发现用户数据泄露
2026-05-14 14:41:58
阶跃最新语音模型成为Artificial Analysis评测榜中国第一
2026-05-09 14:22:11
OpenAI将收购人工智能安全平台Promptfoo
2026-03-10 08:58:57
OpenAI据悉拟在ChatGPT中接入视频生成工具Sora
2026-03-11 16:17:18
奥特曼趁马斯克出差爆猛料:他曾想让子女继承OpenAI
2026-05-13 12:33:09
OpenAI首席财务官:公司或将筹集更多资金 未来可能考虑通过公开市场融资
2026-05-15 16:58:46
OpenAI发布20颗HBM内存堆栈的芯片专利
2026-04-23 17:19:48
24小时热文
更多
扫一扫体验小程序