综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
OpenAI 宣布 macOS 版 ChatGPT 应用将于 2026 年 1 月 15 日停用“语音模式”,以专注提供更统一和改进的语音体验。此变更仅移除语音功能入口,文本对话及其他功能不受影响。Windows、iOS 和 Android 等平台的语音功能将继续正常提供。分析认为,OpenAI 或正在重建底层语音架构,现有 Mac 版语音功能可能因技术落后而被暂时移除,未来或随新系统重新上线。在此期间,Mac 用户可使用网页端或移动设备进行语音交流。
原文链接
11月25日,OpenAI宣布ChatGPT正式将“语音模式”整合至主聊天界面,支持多模态交互。用户可在语音对话中实时查看地图、图片等视觉信息及文字转录,无需切换模式,体验更无缝。新版亮点在于语音回答时同步呈现相关视觉内容,并生成对话的文字记录,方便回顾。为满足不同需求,设置中新增开关,可切换回旧版独立语音模式。此次更新体现了OpenAI拓展AI应用边界的持续努力,此前已推出多项新功能,如AI购物助手、群聊功能和GPT-5.1模型等。
原文链接
8月17日,OpenAI在ChatGPT网页应用语音模式中新增“语音速度”选项,用户可通过滑块调节语速,范围为0.5至2.0倍速,但目前该功能仍处于隐藏状态。同时,新增“自定义指令前缀”功能,可让语音模式记住用户指令,减少重复操作。例如,系统可根据预设提示词调整回复风格,避免受用户临时指令影响。此外,OpenAI近期还推出了升级版模型选择器,提供高精度、快速和自动三种模式,并恢复了付费用户对GPT-4模型的使用权限。这些更新进一步提升了用户体验及功能灵活性。
原文链接
6月8日消息,ChatGPT为其付费用户推出了高级语音模式升级。此次升级显著提升了语音的自然度与情感表达,使交互更具“人情味”。新增功能包括多语言翻译,用户可请求语音翻译,系统将在对话中持续提供服务。此更新基于此前对语音模式的改进,优化了语速、停顿及口音问题。不过,测试显示部分语音选项可能存在轻微音频质量下降及音调变化,开发团队正努力解决。此外,语音模式仍偶现“幻觉”现象,如广告声或背景音乐。
原文链接
近期,ChatGPT高级语音模式被曝出多个广告植入Bug,引发网友热议。一位付费用户在正常对话中突遇广告推送,内容涉及营养计划Prolon的推广。此外,有用户测试发现,连续输入“A”会导致ChatGPT播放广告或进入机械读音循环,甚至出现播放音乐的情况。OpenAI技术人员解释称,这是幻觉现象而非故意插入广告,但部分网友质疑其真实性,认为可能是训练数据中的音频片段被误触发。与其他AI对比,如豆包和腾讯元宝,它们并未出现类似问题。此事反映了大模型在语音功能上的潜在漏洞,具体原因仍需官方进一步澄清。
原文链接
近日,ChatGPT付费用户的高级语音模式遭遇广告Bug,引发热议。一位付费用户在正常聊天时,ChatGPT突然切换至广告模式,推荐了名为Prolon的营养计划网站。随后,该用户在社交媒体上质疑是否在付费用户上测试广告。无独有偶,有用户让ChatGPT连续读字母“A”,结果系统不仅机械化发音,还在27秒后插入了DirectTV的广告内容。类似情况还包括播放音乐或鬼畜式重复发音。OpenAI技术人员回应称这是幻觉而非广告插入,但不少网友仍认为存在数据反刍的可能性。与其他AI对比,如豆包和腾讯元宝,则未出现类似问题。此事再次引发对AI训练数据及算法透明度的讨论。
原文链接
5月28日,Anthropic公司宣布为其Claude聊天机器人推出语音模式,目前该功能正在测试阶段,预计未来几周内以英语版本上线。用户可通过语音与Claude完成完整对话,默认由Claude Sonnet 4模型支持。此功能让用户在双手忙碌时也能轻松交流,并能通过屏幕显示关键内容及语音回应改变交互方式。Anthropic的语音模式允许用户选择五种不同语音风格,并可在文本与语音模式间切换,同时保留对话记录和总结。值得注意的是,语音对话计入常规使用配额,免费用户预计可进行20至30次对话,而Google Workspace集成需付费订阅用户或企业计划支持。
原文链接
5月5日,Grok宣布其语音模式正式上线,支持iOS及Android用户使用。此前,Grok 3仅对X Premium+和SuperGrok订阅用户开放,新功能让普通用户也能体验语音交互。该模式允许用户通过自然语言与AI对话,具备Ara和Grok两种音色选择,并支持个性化设置与对话分享功能。值得一提的是,马斯克近日将自己的社交媒体昵称改为“groklon rust”。Grok 3的语音模式于今年2月20日首次面向公众免费开放,但因服务器压力,未来可能存在限制。
原文链接
3月25日,OpenAI升级ChatGPT高级语音模式,优化对话流畅性。新功能减少打断并新增暂停功能,方便用户整理思路。付费用户可享受个性化语音选择,包括9种风格化人声,如随和的Arbor或自信的Ember等。此更新已面向全体用户开放,但免费版有使用限制。此前反馈的‘意外插话’问题得到修复,iPhone用户尤其受益。OpenAI研究团队通过视频展示更新体验,强调改进后的自然与生动交互。
原文链接
《科创板日报》26日报道称,OpenAI宣布向免费用户推出GPT4o mini驱动的高级语音模式,使免费用户也能每日使用此功能。该语音模式具有与GPT-4o相似的自然对话节奏和语调,且服务成本更低。
原文链接
加载更多
暂无内容