1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

OpenAI发布三款新音频模型,涵盖语音转文本和文本转语音功能,助力开发者打造高效语音应用。

新模型的核心亮点包括: - gpt-4o-transcribe:大幅降低单词错误率(WER),在多语言基准测试中优于Whisper。 - gpt-4o-mini-transcribe:基于GPT-4o-mini架构,速度更快,适合资源受限场景。 - gpt-4o-mini-tts:支持“可引导性”,开发者可控制语音风格,定价每分钟0.015美元。

gpt-4o-transcribe采用多样化音频数据集训练,提高转录可靠性,适用于复杂场景如呼叫中心和会议记录。定价与Whisper相同,每分钟0.006美元。

gpt-4o-mini-tts通过强化学习提升转录精度,支持多种语音风格,增强用户体验。此外,OpenAI推出语音流式处理、降噪及语义语音检测等功能,简化开发流程。

新模型已在全球开发者中开放,并提供演示网站OpenAI.fm,支持定制化音频生成。未来,语音领域的趋势正从单纯的功能性转向情感化交互,强调更自然的人机沟通。

原文链接
本文链接:https://kx.umi6.com/article/15875.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
迪士尼与OpenAI达成战略合作与内容授权协议
2025-12-13 13:53:11
OpenAI 深夜炸场:GPT-5.2 模型发布,做表格 / PPT、处理超长上下文是专长
2025-12-12 03:25:42
消息称 OpenAI 算力利润率攀升至 70%,相比去年底大幅增长
2025-12-22 07:26:28
OpenAI首席传播官将离职
2025-12-16 12:39:41
阶跃星辰:旗下开源语音模型 Step-Audio-R1.1 在全球权威评测中登顶
2026-01-15 15:42:50
OpenAI:将自行承担“星际之门”项目能源费用,确保不会推高电价
2026-01-21 13:12:22
美国甲骨文公司:不会延迟交付为OpenAI建造的数据中心
2025-12-13 20:07:27
OpenAI 更新手机版 ChatGPT,现支持手动调节 AI“思考深度”
2025-12-30 09:10:29
年薪 55.5 万美元 + 股权,OpenAI 急招“安全防范负责人”
2025-12-28 08:15:58
OpenAI 计划于今年下半年推出首款硬件设备
2026-01-20 00:22:40
消息称 OpenAI 要求外包人员上传真实工作成果,律师警告称风险极高
2026-01-12 09:24:27
OpenAI加码音频人工智能研发 备战首款硬件设备
2026-01-01 23:43:33
OpenAI 新功能曝光:代号“奏鸣曲”,猜测与 ChatGPT 音频体验有关
2026-01-19 19:09:37
24小时热文
更多
扫一扫体验小程序