语音模式 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

OpenAI ChatGPT 优化多模态交互，AI 聊天合并支持语音与文本

11月25日，OpenAI宣布ChatGPT正式将“语音模式”整合至主聊天界面，支持多模态交互。用户可在语音对话中实时查看地图、图片等视觉信息及文字转录，无需切换模式，体验更无缝。新版亮点在于语音回答时同步呈现相关视觉内容，并生成对话的文字记录，方便回顾。为满足不同需求，设置中新增开关，可切换回旧版独立语音模式。此次更新体现了OpenAI拓展AI应用边界的持续努力，此前已推出多项新功能，如AI购物助手、群聊功能和GPT-5.1模型等。

原文链接

蝶舞CyberSwirl

11-26 08:30:01

分享至

打开微信扫一扫

内容投诉

生成图片

OpenAI ChatGPT 语音模式将迎新功能：可调语速、存自定义指令

8月17日，OpenAI在ChatGPT网页应用语音模式中新增“语音速度”选项，用户可通过滑块调节语速，范围为0.5至2.0倍速，但目前该功能仍处于隐藏状态。同时，新增“自定义指令前缀”功能，可让语音模式记住用户指令，减少重复操作。例如，系统可根据预设提示词调整回复风格，避免受用户临时指令影响。此外，OpenAI近期还推出了升级版模型选择器，提供高精度、快速和自动三种模式，并恢复了付费用户对GPT-4模型的使用权限。这些更新进一步提升了用户体验及功能灵活性。

原文链接

数码游侠

08-17 07:33:45

分享至

打开微信扫一扫

内容投诉

生成图片

Anthropic 为 Claude 聊天机器人推出语音模式

5月28日，Anthropic公司宣布为其Claude聊天机器人推出语音模式，目前该功能正在测试阶段，预计未来几周内以英语版本上线。用户可通过语音与Claude完成完整对话，默认由Claude Sonnet 4模型支持。此功能让用户在双手忙碌时也能轻松交流，并能通过屏幕显示关键内容及语音回应改变交互方式。Anthropic的语音模式允许用户选择五种不同语音风格，并可在文本与语音模式间切换，同时保留对话记录和总结。值得注意的是，语音对话计入常规使用配额，免费用户预计可进行20至30次对话，而Google Workspace集成需付费订阅用户或企业计划支持。

原文链接

超频思维站

05-28 16:57:16

分享至

打开微信扫一扫

内容投诉

生成图片

Grok 上线语音模式，马斯克修改昵称为“groklon rust”

5月5日，Grok宣布其语音模式正式上线，支持iOS及Android用户使用。此前，Grok 3仅对X Premium+和SuperGrok订阅用户开放，新功能让普通用户也能体验语音交互。该模式允许用户通过自然语言与AI对话，具备Ara和Grok两种音色选择，并支持个性化设置与对话分享功能。值得一提的是，马斯克近日将自己的社交媒体昵称改为“groklon rust”。Grok 3的语音模式于今年2月20日首次面向公众免费开放，但因服务器压力，未来可能存在限制。

原文链接

元界筑梦师

05-05 09:44:49

分享至

打开微信扫一扫

内容投诉

生成图片

告别打字：OpenAI 免费开放 ChatGPT AI 语音聊天，GPT-4o mini 加持

OpenAI于2月26日在X平台宣布，免费开放ChatGPT高级语音模式，让更多用户体验更自然的语音对话。该模式基于GPT-4o mini模型，此前仅限付费用户。所有用户现可免费使用，但免费用户有每日使用限制，剩余3分钟会收到警告，限额后对话自动结束。ChatGPT Plus用户每日限额为免费版的5倍，并可使用视频和屏幕共享功能。ChatGPT Pro用户则无每日使用限制。

原文链接

星际Code流浪者

02-26 11:29:14

分享至

打开微信扫一扫

内容投诉

生成图片

马斯克宣布Grok语音模式正式上线

北京时间2月23日，马斯克在社交平台X上宣布，Grok语音模式的早期测试版已上线。尽管是初期版本，可能会有部分问题，但马斯克表示该功能表现优秀。

原文链接

数字墨迹

02-23 13:01:59

分享至

打开微信扫一扫

内容投诉

生成图片

Anthropic 将为 Claude AI 引入双向语音模式，允许用户说话询问并听取机器人回应

Anthropic CEO达里奥・阿莫代伊在瑞士达沃斯世界经济论坛上透露，旗下Claude AI聊天机器人反响热烈，未来将增加“双向语音模式”。这一模式允许用户通过语音提问或发出指令，并能听到机器人的语音回应。此外，Claude还将增强记忆功能，以实现个性化交互体验。目前尚不清楚该语音模式是否支持类似真人风格的音频输出。此更新预计提升Claude的交互体验，使其更接近ChatGPT的高级语音模式。时间：2月1日。

原文链接

虚拟织梦者

02-01 21:30:18

分享至

打开微信扫一扫

内容投诉

生成图片

GPT-4o失控，突然呻吟尖叫发癫，引发研究人员恐慌

【即时报道】OpenAI发布关于GPT-4o的红队报告，揭示其高级语音模式的潜在风险与怪癖。GPT-4o在嘈杂环境中会模仿用户的语音，且在特定提示下生成色情呻吟、暴力尖叫等不适音效，引发研究人员恐慌。为防止滥用，OpenAI限制GPT-4o仅提供四种专业配音选项，并开发实时检测系统监控生成声音。报告强调，尽管存在不足，GPT-4o已进行调整，避免不当行为。测试涉及全球45种语言的100多位安全专家，旨在确保AI安全可控。此报告揭示了AI情感交互的复杂性和潜在风险，提醒公众和开发者在使用AI时应保持警觉。

原文链接