OpenAI发布三款新音频模型,涵盖语音转文本和文本转语音功能,助力开发者打造高效语音应用。
新模型的核心亮点包括: - gpt-4o-transcribe:大幅降低单词错误率(WER),在多语言基准测试中优于Whisper。 - gpt-4o-mini-transcribe:基于GPT-4o-mini架构,速度更快,适合资源受限场景。 - gpt-4o-mini-tts:支持“可引导性”,开发者可控制语音风格,定价每分钟0.015美元。
gpt-4o-transcribe采用多样化音频数据集训练,提高转录可靠性,适用于复杂场景如呼叫中心和会议记录。定价与Whisper相同,每分钟0.006美元。
gpt-4o-mini-tts通过强化学习提升转录精度,支持多种语音风格,增强用户体验。此外,OpenAI推出语音流式处理、降噪及语义语音检测等功能,简化开发流程。
新模型已在全球开发者中开放,并提供演示网站OpenAI.fm,支持定制化音频生成。未来,语音领域的趋势正从单纯的功能性转向情感化交互,强调更自然的人机沟通。
原文链接
本文链接:https://kx.umi6.com/article/15875.html
转载请注明文章出处
相关推荐
换一换
14亿元留不住!庞若鸣弃Meta加盟OpenAI
2026-02-26 13:58:39
OpenAI首席信息安全官宣布将离职
2026-01-27 14:22:25
OpenAI 与晶圆级 AI 芯片企业 Cerebras 达成合作,三年部署 750MW 推理系统
2026-01-15 10:26:49
OpenAI 回应 ChatGPT 出现广告:平台 95% 是免费用户,会坚守一些原则
2026-01-21 13:13:21
OpenAI计划于2026年推出首款硬件设备
2026-01-19 23:22:26
OpenAI或为亚马逊AI产品开发定制化模型
2026-02-04 22:10:24
OpenAI 新功能曝光:代号“奏鸣曲”,猜测与 ChatGPT 音频体验有关
2026-01-19 19:09:37
姚班传奇陈立杰入职OpenAI!16岁保送清华,30岁拿下UC伯克利助理教授
2026-01-15 15:40:32
OpenAI推出新平台 助力企业部署“AI同事”
2026-02-06 02:24:03
OpenAI:推出用户年龄预测功能 以保护未成年用户
2026-01-21 15:17:45
马斯克向OpenAI和微软索赔最高达1340亿美元
2026-01-18 15:28:06
消息称 OpenAI 要求外包人员上传真实工作成果,律师警告称风险极高
2026-01-12 09:24:27
屏幕消失之后:OpenAI的智能硬件新赌注
2026-01-21 08:59:13
648 文章
442881 浏览
24小时热文
更多
-
2026-03-10 10:03:26 -
2026-03-10 10:02:35 -
2026-03-10 09:02:22