
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2025年7月11日,前百川智能联合创始人焦可推出AI语音创业项目“来福”,产品已上线App Store。该项目由其新公司“北京耳朵时间科技有限公司”开发,成立于2025年2月,注册资本100万元,并获知名美元资本投资。“来福”定位为AI驱动的语音电台应用,支持实时语音互动,探索日常化、情绪化的语音交互场景,目前仅限邀请码用户测试。团队规模约10人,成员多来自大厂及名校。此外,国内AI播客领域尚处早期,其他创业项目如ChatPods和“可听.ai”也崭露头角,但大厂尚未专注此方向。焦可选择切入情绪化语音交互赛道,市场前景有待验证。
原文链接
过去半年,AI语音赛道爆发,多家公司获大额融资。例如,Wispr Flow完成3000万美元A轮融资,ElevenLabs估值超30亿美元。Meta、OpenAI等巨头也积极布局语音模型。声智副总裁黄赟贺指出,语音对话因大模型加持进化为AI时代入口,声音首次实现“可编程化”,使语音交互迈向新阶段。然而,“听清”仍是技术难点,受物理限制需长期突破。未来,语音交互将从功能导向转向情感导向,通过情绪识别、意图理解等方式实现人机共情,并构建融合声学、视觉与语言的“声学世界模型”,推动具身智能发展。
原文链接
财联社6月26日报道,美国科技巨头Meta Platforms正与AI语音初创公司PlayAI进行深入收购谈判,计划获取其技术资产并吸纳部分员工。PlayAI专注于开发自然语音交互技术,2024年末完成2100万美元融资。此举是扎克伯格组建‘超级智能’团队的一部分,旨在提升AI语音助手和免提设备能力。此前,Meta已收购Scale AI近半股份,并从OpenAI挖角研究人员。此外,Meta还曾与Perplexity AI、Runway AI等公司洽谈收购事宜。
原文链接
4月12日,MiniMax推出最新语音生成模型Speech-02,其升级版Speech-02-HD于5月15日登顶两大榜单,技术指标领先竞品。近期,多家AI语音创企获融资,如Cartesia获6400万美元融资,Hume AI获5000万美元融资,同时Amazon、Google等大厂也在布局相关技术。为评估当前AI语音在实际场景中的表现,测试选择了直播带货、语音陪伴、有声书三个场景,MiniMax、DubbingX等五款模型参与测试。结果显示,DubbingX在中文有声书场景中表现突出,尤其在复合情感表达上优于其他产品,而ElevenLabs和Sesame在英文场景中表现欠佳。尽管部分模型在情感传达上有所进步,但在复杂场景中仍需更多工程优化。AI语音在toB领域的应用已较广泛,但在toC场景中仍面临挑战,未来技术发展值得期待。
原文链接
4月12日,MiniMax推出最新语音生成模型Speech-02,5月15日其升级版Speech-02-HD登顶多个榜单。AI语音赛道火热,多家企业完成融资,如Cartesia获6400万美元融资,Hume AI获5000万美元融资,Google和Amazon也在布局相关技术。近期测试显示,AI在中文有声书配音中,DubbingX表现较优,能较好传达“愤怒”与“悲伤”情绪;但在英文有声书场景中,多数模型未达及格标准。直播带货场景中,AI情感表达合格但场景适配性差,而AI陪伴场景表现中规中矩。总体来看,AI语音在简单场景中表现尚可,复杂场景仍需改进。未来,toB领域应用前景广阔,如AI助手和陪伴硬件,我们将持续关注其发展。
原文链接
标题:超越OpenAI、拿下全球双料第一,“AI吴彦祖”背后大模型SOTA了!
正文:
超越OpenAI!国产大模型MiniMax最新发布的Speech-02一举拿下Artificial Analysis Speech Arena和Hugging Face TTS Arena两项全球权威语音基准测评...
原文链接
据快科技5月7日消息,美国NBC电视台计划在10月重播NBA赛事时,使用已故体育解说员Jim Fagan的AI生成声音。Jim Fagan于2017年去世,其独特的声音曾为1990至2002年的NBC篮球赛事增色,尤其为迈克尔·乔丹、沙奎尔·奥尼尔和哈基姆·奥拉朱旺等球星的宣传片提供解说。NBC将把AI声音应用于特定的片头序列、节目开场及宣传片中。Fagan的家族成员对此表示支持,希望借助AI技术重现他的声音。值得一提的是,NBC此前在2024年巴黎奥运会期间已尝试AI配音技术,利用体育解说员Al Michaels的AI声音生成个性化赛事回顾。
原文链接
5月7日消息,美国NBC电视台宣布将在今年10月的NBA赛事转播中启用已故体育解说员Jim Fagan的AI生成声音。Jim Fagan于1990年至2002年担任NBC“NBA on NBC”节目的解说,其声音成为当时宣传片的经典标志,还为迈克尔·乔丹、沙奎尔·奥尼尔等球星制作过相关视频。在获得家属许可后,NBC将利用AI技术复刻他的声音,这些声音将在部分片头、节目开场及宣传片中呈现。NBC体育总裁Rick Cordella称此举是对Jim遗产的致敬。这并非NBC首次尝试AI配音,去年巴黎奥运会期间已用AI模仿解说员Al Michaels的声音为赛事提供个性化回顾。
原文链接
4月23日,AI企业Perplexity宣布为其苹果iOS平台的应用程序推出AI语音助手功能,挑战苹果Siri。该第三方语音助手可实现地图搜索、餐厅预订、邮件草拟、提醒设置及媒体播放等操作。尽管功能接近Siri,但作为非官方产品,其性能和兼容性可能仍有差异。Perplexity强调其助手通过网页浏览和多应用操作满足用户需求。这一新功能为用户提供更多选择,但苹果官方服务的优势依然明显。
原文链接
4月9日,亚马逊发布全新AI语音模型Nova Sonic,性能对标OpenAI和谷歌。Nova Sonic具备快速语音处理能力,能生成自然流畅的语音,在关键指标测试中表现优异。通过亚马逊Bedrock平台提供服务,其成本较GPT-4o低80%,并已为Alexa+提供技术支持。Nova Sonic支持双向流式API接入,具备精准的语音识别能力,尤其在多语言环境下表现出色,如英语、法语等的平均单词错误率仅4.2%。此外,其感知延迟为1.09秒,优于GPT-4o的1.18秒。亚马逊计划扩展其多模态AI模型,涵盖图像、视频及感官数据,以推进人工通用智能(AGI)战略。Nova Sonic标志着亚马逊在AI领域的持续投入与创新。
原文链接
加载更多

暂无内容