1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:超越OpenAI、拿下全球双料第一,“AI吴彦祖”背后大模型SOTA了!

正文:
超越OpenAI!国产大模型MiniMax最新发布的Speech-02一举拿下Artificial Analysis Speech Arena和Hugging Face TTS Arena两项全球权威语音基准测评榜首,成为榜单前十中唯一的国产玩家。

Speech-02的核心亮点在于超拟人、个性化和多样性。它不仅能完美模拟专业播音腔,还能根据文章内容自动调整语气和情绪,中英混杂也不在话下。只需几秒参考语音,即可实现超逼真复刻,且定价仅为ElevenLabs的一半甚至四分之一。

Speech-02支持32种语言,涵盖不同口音、性别和年龄,且可复刻任意音色。通过最少10秒的参考样本,即可完成音色模仿,并支持情绪等细节调整。例如,用霉霉的纽约大学演讲片段生成中文版音色,效果依然出色。

技术上,Speech-02采用自回归Transformer架构,引入可学习说话者编码器,无需参考文本即可实现零样本克隆。同时,基于Flow-VAE的流匹配模型提升了音质和相似性。模型已在教育、智能座舱、AI玩具等多个领域落地,展现了强大的商业潜力。

MiniMax不仅在技术上领先,还通过与高途、极狐汽车等合作,推动AI语音在教育、娱乐等场景的应用。此外,MiniMax还在探索AI玩具、粤语天气预报等新领域,展现其持续创新的能力。

MiniMax的技术优势源于其全模态布局,不仅在语音领域领先,还推出了首个大规模线性注意力机制的文本大模型,并开源了MiniMax-Text-01和MiniMax-VL-01。未来,MiniMax将继续引领“模型即产品”的发展趋势,为行业带来更多可能性。

原文链接
本文链接:https://kx.umi6.com/article/18698.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
李飞飞的答案:大模型之后,Agent向何处去?
2025-09-05 09:13:59
1300000000000000!谷歌每月Tokens消耗量曝光(别数了是千万亿)
2025-10-11 09:26:13
大模型驱动算力革命 AI芯片迎破局新机遇
2025-09-18 07:47:51
字节对大模型方向加码期权激励 核心技术员工最高可获百万元
2025-09-03 15:50:37
腾讯发布全新大模型混元3D 3.0
2025-09-16 10:11:57
汪军对话 Rich Sutton:大模型在一定程度上分散了我们对智能理解的注意力
2025-09-28 11:53:51
大模型又迎来重要玩家!美团首个开源大模型来了
2025-09-01 18:28:28
DeepSeek新大招曝光:下一步智能体
2025-09-05 10:15:28
大模型“记性差一点”反而更聪明!金鱼损失随机剔除token,让AI不再死记硬背
2025-09-03 17:49:26
我国大模型数量居全球首位,达到 1509 个、占比达 40%
2025-07-27 13:57:47
在上海WAIC,800展商无一不想成为黄仁勋
2025-07-27 07:50:27
MiniMax与Kimi,隔空交手
2025-11-03 09:10:57
Karpathy 最新发文:别把 AI 当人看,它没欲望也不怕死
2025-11-22 19:29:36
24小时热文
更多
扫一扫体验小程序