OpenAI发布三款新音频模型,涵盖语音转文本和文本转语音功能,助力开发者打造高效语音应用。
新模型的核心亮点包括: - gpt-4o-transcribe:大幅降低单词错误率(WER),在多语言基准测试中优于Whisper。 - gpt-4o-mini-transcribe:基于GPT-4o-mini架构,速度更快,适合资源受限场景。 - gpt-4o-mini-tts:支持“可引导性”,开发者可控制语音风格,定价每分钟0.015美元。
gpt-4o-transcribe采用多样化音频数据集训练,提高转录可靠性,适用于复杂场景如呼叫中心和会议记录。定价与Whisper相同,每分钟0.006美元。
gpt-4o-mini-tts通过强化学习提升转录精度,支持多种语音风格,增强用户体验。此外,OpenAI推出语音流式处理、降噪及语义语音检测等功能,简化开发流程。
新模型已在全球开发者中开放,并提供演示网站OpenAI.fm,支持定制化音频生成。未来,语音领域的趋势正从单纯的功能性转向情感化交互,强调更自然的人机沟通。
原文链接
本文链接:https://kx.umi6.com/article/15875.html
转载请注明文章出处
相关推荐
换一换
放开成人内容,OpenAI是为了提升性能?
2025-10-22 17:49:49
120 亿年收入撬动 1 万亿美元订单:OpenAI 烧钱搞 AI 基建,奥尔特曼称短期内不优先考虑盈利
2025-10-09 09:09:35
OpenAI收紧Sora监管 承诺加强防范AI深伪内容
2025-10-21 07:19:29
黄仁勋回应AMD送股OpenAI:很高明的交易,OpenAI没钱给我付账
2025-10-11 09:15:33
OpenAI 的网络浏览器:ChatGPT Atlas 正式发布,能让 AI“替你上网”
2025-10-22 02:34:53
OpenAI秘密项目曝光:进军投行业务
2025-10-22 16:49:15
OpenAl为何“情迷”变现
2025-10-19 12:48:56
把成年人当成年人看,OpenAI 奥尔特曼宣布将为 ChatGPT 开放更多限制内容
2025-10-15 04:25:53
飙涨23.7%,芯片巨头终于等来“泼天机遇”
2025-10-09 09:13:48
OpenAI 前瞻 ChatGPT 终极形态:迈步“App Store”时代,搭积木式创建 AI 智能体
2025-10-07 07:46:59
OpenAI要刮油,谁会掉层皮?
2025-10-02 12:11:32
满屏 AI 换脸,OpenAI 新应用 Sora 遭自家研究员吐槽
2025-10-02 11:08:52
软银为进一步投资OpenAI做准备:拟借款50亿美元充实资金储备
2025-10-11 10:34:20
528 文章
241067 浏览
24小时热文
更多
-
2025-10-24 08:30:42 -
2025-10-24 08:29:28 -
2025-10-24 08:28:19