4月12日,MiniMax推出最新语音生成模型Speech-02,其升级版Speech-02-HD于5月15日登顶两大榜单,技术指标领先竞品。近期,多家AI语音创企获融资,如Cartesia获6400万美元融资,Hume AI获5000万美元融资,同时Amazon、Google等大厂也在布局相关技术。为评估当前AI语音在实际场景中的表现,测试选择了直播带货、语音陪伴、有声书三个场景,MiniMax、DubbingX等五款模型参与测试。结果显示,DubbingX在中文有声书场景中表现突出,尤其在复合情感表达上优于其他产品,而ElevenLabs和Sesame在英文场景中表现欠佳。尽管部分模型在情感传达上有所进步,但在复杂场景中仍需更多工程优化。AI语音在toB领域的应用已较广泛,但在toC场景中仍面临挑战,未来技术发展值得期待。
原文链接
本文链接:https://kx.umi6.com/article/19814.html
转载请注明文章出处
相关推荐
换一换
广东:正制定《广东省 “人工智能 +” 行动方案》 首批应用场景清单下周发布
2025-04-01 15:37:47
AI成为工业机器人“大脑”,场景落地已有实例
2024-12-31 16:44:18
OpenAI推出小型语音模型GPT-5 Pro
2025-10-07 03:44:27
机器人竞赛升级!“加速进化”踢出任意球,“旋风小子”订单排到明年|直击无锡具身智能运动会
2025-04-25 19:23:05
AI 语音爆发的这半年,一位“局中人”看到的赛道爆发逻辑
2025-07-03 12:21:05
记者手记 | 见证机器人进化:那些笨拙的今天,正在走出稳健的明天
2025-04-25 19:20:57
工信部:截至上半年末,我国生成式人工智能产品用户规模达 5.15 亿
2025-11-27 12:32:06
超越OpenAI、拿下全球双料第一,“AI吴彦祖”背后大模型SOTA了!
2025-05-16 17:26:17
雷军也成了AI语音的受害者?
2024-10-11 14:06:04
多款AI应用重磅亮相:英特尔和微软举办 AI PC品鉴会
2025-05-27 20:22:21
OpenAI发布GPT-realtime语音对话模型
2025-08-29 08:37:51
医疗大模型,集体下沉
2025-04-21 15:43:38
阿里通义百聆推出语音模型新版本:3 秒录音即可“复制”9 种语言、18 种方言
2025-12-15 16:47:57
635 文章
399656 浏览
24小时热文
更多
-
2026-01-23 17:11:08 -
2026-01-23 17:10:00 -
2026-01-23 17:08:55