gpt-realtime - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

OpenAI发布GPT-realtime语音对话模型

当地时间周四，OpenAI发布全新语音模型GPT-realtime，专用于语音AI Agent。该模型生成自然流畅语音，可模仿人类语调、情感及语速，支持图像理解并与语音或文本对话结合，适用于客服、教育、金融、医疗等领域。新增Marin与Cedar两种特色语音，并全面升级原有8种语音，进一步提升用户体验。

原文链接

GhostPilot

08-29 08:37:51

gpt-realtime

OpenAI

语音模型

分享至

打开微信扫一扫

内容投诉

生成图片

OpenAI 推出 gpt-realtime 语音对话模型：支持情感感知、多语言无缝切换

8月29日，OpenAI正式推出gpt-realtime语音对话模型并投入生产环境。该模型支持情感感知、多语言无缝切换及非语言信号捕捉，可调整语气和语调，新增两种语音并对现有语音优化。性能显著提升，在多项基准测试中准确率大幅提高。新增图像输入功能，能基于截图或照片交互，同时优化工具集成流程，支持外部工具连接与复用提示词功能。开发者还可设置token上限和精简多轮对话以降低成本。价格下调20%，并提供问题内容检测能力及欧盟数据本地化选项，符合隐私法规。

原文链接