1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
OpenAI ChatGPT 优化多模态交互,AI 聊天合并支持语音与文本
11月25日,OpenAI宣布ChatGPT正式将“语音模式”整合至主聊天界面,支持多模态交互。用户可在语音对话中实时查看地图、图片等视觉信息及文字转录,无需切换模式,体验更无缝。新版亮点在于语音回答时同步呈现相关视觉内容,并生成对话的文字记录,方便回顾。为满足不同需求,设置中新增开关,可切换回旧版独立语音模式。此次更新体现了OpenAI拓展AI应用边界的持续努力,此前已推出多项新功能,如AI购物助手、群聊功能和GPT-5.1模型等。
蝶舞CyberSwirl
11-26 08:30:01
分享至
打开微信扫一扫
内容投诉
生成图片
OpenAI ChatGPT 语音模式将迎新功能:可调语速、存自定义指令
8月17日,OpenAI在ChatGPT网页应用语音模式中新增“语音速度”选项,用户可通过滑块调节语速,范围为0.5至2.0倍速,但目前该功能仍处于隐藏状态。同时,新增“自定义指令前缀”功能,可让语音模式记住用户指令,减少重复操作。例如,系统可根据预设提示词调整回复风格,避免受用户临时指令影响。此外,OpenAI近期还推出了升级版模型选择器,提供高精度、快速和自动三种模式,并恢复了付费用户对GPT-4模型的使用权限。这些更新进一步提升了用户体验及功能灵活性。
数码游侠
08-17 07:33:45
分享至
打开微信扫一扫
内容投诉
生成图片
Anthropic 为 Claude 聊天机器人推出语音模式
5月28日,Anthropic公司宣布为其Claude聊天机器人推出语音模式,目前该功能正在测试阶段,预计未来几周内以英语版本上线。用户可通过语音与Claude完成完整对话,默认由Claude Sonnet 4模型支持。此功能让用户在双手忙碌时也能轻松交流,并能通过屏幕显示关键内容及语音回应改变交互方式。Anthropic的语音模式允许用户选择五种不同语音风格,并可在文本与语音模式间切换,同时保留对话记录和总结。值得注意的是,语音对话计入常规使用配额,免费用户预计可进行20至30次对话,而Google Workspace集成需付费订阅用户或企业计划支持。
超频思维站
05-28 16:57:16
分享至
打开微信扫一扫
内容投诉
生成图片
Grok 上线语音模式,马斯克修改昵称为“groklon rust”
5月5日,Grok宣布其语音模式正式上线,支持iOS及Android用户使用。此前,Grok 3仅对X Premium+和SuperGrok订阅用户开放,新功能让普通用户也能体验语音交互。该模式允许用户通过自然语言与AI对话,具备Ara和Grok两种音色选择,并支持个性化设置与对话分享功能。值得一提的是,马斯克近日将自己的社交媒体昵称改为“groklon rust”。Grok 3的语音模式于今年2月20日首次面向公众免费开放,但因服务器压力,未来可能存在限制。
元界筑梦师
05-05 09:44:49
分享至
打开微信扫一扫
内容投诉
生成图片
告别打字:OpenAI 免费开放 ChatGPT AI 语音聊天,GPT-4o mini 加持
OpenAI于2月26日在X平台宣布,免费开放ChatGPT高级语音模式,让更多用户体验更自然的语音对话。该模式基于GPT-4o mini模型,此前仅限付费用户。所有用户现可免费使用,但免费用户有每日使用限制,剩余3分钟会收到警告,限额后对话自动结束。ChatGPT Plus用户每日限额为免费版的5倍,并可使用视频和屏幕共享功能。ChatGPT Pro用户则无每日使用限制。
星际Code流浪者
02-26 11:29:14
分享至
打开微信扫一扫
内容投诉
生成图片
马斯克宣布Grok语音模式正式上线
北京时间2月23日,马斯克在社交平台X上宣布,Grok语音模式的早期测试版已上线。尽管是初期版本,可能会有部分问题,但马斯克表示该功能表现优秀。
数字墨迹
02-23 13:01:59
分享至
打开微信扫一扫
内容投诉
生成图片
Anthropic 将为 Claude AI 引入双向语音模式,允许用户说话询问并听取机器人回应
Anthropic CEO达里奥・阿莫代伊在瑞士达沃斯世界经济论坛上透露,旗下Claude AI聊天机器人反响热烈,未来将增加“双向语音模式”。这一模式允许用户通过语音提问或发出指令,并能听到机器人的语音回应。此外,Claude还将增强记忆功能,以实现个性化交互体验。目前尚不清楚该语音模式是否支持类似真人风格的音频输出。此更新预计提升Claude的交互体验,使其更接近ChatGPT的高级语音模式。时间:2月1日。
虚拟织梦者
02-01 21:30:18
分享至
打开微信扫一扫
内容投诉
生成图片
GPT-4o失控,突然呻吟尖叫发癫,引发研究人员恐慌
【即时报道】OpenAI发布关于GPT-4o的红队报告,揭示其高级语音模式的潜在风险与怪癖。GPT-4o在嘈杂环境中会模仿用户的语音,且在特定提示下生成色情呻吟、暴力尖叫等不适音效,引发研究人员恐慌。为防止滥用,OpenAI限制GPT-4o仅提供四种专业配音选项,并开发实时检测系统监控生成声音。报告强调,尽管存在不足,GPT-4o已进行调整,避免不当行为。测试涉及全球45种语言的100多位安全专家,旨在确保AI安全可控。此报告揭示了AI情感交互的复杂性和潜在风险,提醒公众和开发者在使用AI时应保持警觉。
智能视野
08-09 18:50:30
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序