
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
当地时间周四,OpenAI发布全新语音模型GPT-realtime,专用于语音AI Agent。该模型生成自然流畅语音,可模仿人类语调、情感及语速,支持图像理解并与语音或文本对话结合,适用于客服、教育、金融、医疗等领域。新增Marin与Cedar两种特色语音,并全面升级原有8种语音,进一步提升用户体验。
原文链接
8月29日,OpenAI正式推出gpt-realtime语音对话模型并投入生产环境。该模型支持情感感知、多语言无缝切换及非语言信号捕捉,可调整语气和语调,新增两种语音并对现有语音优化。性能显著提升,在多项基准测试中准确率大幅提高。新增图像输入功能,能基于截图或照片交互,同时优化工具集成流程,支持外部工具连接与复用提示词功能。开发者还可设置token上限和精简多轮对话以降低成本。价格下调20%,并提供问题内容检测能力及欧盟数据本地化选项,符合隐私法规。
原文链接
加载更多

暂无内容