7月31日,OpenAI宣布向部分已付费订阅的ChatGPT Plus用户开放GPT-4o语音模式的Alpha版本,预计于秋季全面推广。GPT-4o是首个融合文本、视觉及音频输入输出的统一模型,其语音反馈延迟显著缩短,接近无缝对话体验。该模式拥有快速响应、声音逼真等特点,能感知语音中的情感变化,如悲伤、兴奋或歌唱。然而,GPT-4o语音模式强调不会模仿特定个体或公众人物的声音,并会阻止非预设声音的输出。此更新旨在提升用户体验,推动人工智能领域的发展。
原文链接
本文链接:https://kx.umi6.com/article/4270.html
转载请注明文章出处
相关推荐
.png)
换一换
三名Meta新聘AI研究员相继离职
2025-08-27 20:10:25
GPT-5能让普通人变成博士,但魔法依旧没有
2025-08-08 12:10:14
OpenAI 迄今最智能 AI 模型:“六边形战士”GPT-5 登场,准确性、速度、推理能力等全面突破
2025-08-08 01:59:39
硅谷又一个“活久见”:马斯克竟曾邀请扎克伯格参与收购OpenAI
2025-08-22 15:51:25
估值直逼5000亿美元!OpenAI洽谈新一轮员工股权出售
2025-08-06 15:40:49
消息称奥尔特曼淡出 OpenAI 日常管理,聚焦“搞钱”和脑机接口
2025-08-23 07:57:25
GPT-5,要来了?
2025-08-07 11:48:14
马斯克称xAI代码库被盗 涉案员工已跳槽OpenAI
2025-09-01 14:19:22
OpenAI 寻求增加收入,高管称不排除在 ChatGPT 内插入广告的可能
2025-08-15 10:11:06
估值达 5000 亿美元,消息称 OpenAI 就股份出售进行谈判
2025-08-06 10:27:16
还得继续砸钱,OpenAI 预计到 2029 年总支出或超千亿美元
2025-09-06 20:38:03
OpenAI单月营收破10亿美元,CFO坦言仍长期面临算力紧缺
2025-08-21 01:22:02
OpenAI,向所有反对者“举刀”
2025-09-05 19:23:16
471 文章
176397 浏览
24小时热文
更多

-
2025-09-07 06:42:57
-
2025-09-07 00:40:01
-
2025-09-06 23:39:46