标题:超越OpenAI、拿下全球双料第一,“AI吴彦祖”背后大模型SOTA了!
正文:
超越OpenAI!国产大模型MiniMax最新发布的Speech-02一举拿下Artificial Analysis Speech Arena和Hugging Face TTS Arena两项全球权威语音基准测评榜首,成为榜单前十中唯一的国产玩家。
Speech-02的核心亮点在于超拟人、个性化和多样性。它不仅能完美模拟专业播音腔,还能根据文章内容自动调整语气和情绪,中英混杂也不在话下。只需几秒参考语音,即可实现超逼真复刻,且定价仅为ElevenLabs的一半甚至四分之一。
Speech-02支持32种语言,涵盖不同口音、性别和年龄,且可复刻任意音色。通过最少10秒的参考样本,即可完成音色模仿,并支持情绪等细节调整。例如,用霉霉的纽约大学演讲片段生成中文版音色,效果依然出色。
技术上,Speech-02采用自回归Transformer架构,引入可学习说话者编码器,无需参考文本即可实现零样本克隆。同时,基于Flow-VAE的流匹配模型提升了音质和相似性。模型已在教育、智能座舱、AI玩具等多个领域落地,展现了强大的商业潜力。
MiniMax不仅在技术上领先,还通过与高途、极狐汽车等合作,推动AI语音在教育、娱乐等场景的应用。此外,MiniMax还在探索AI玩具、粤语天气预报等新领域,展现其持续创新的能力。
MiniMax的技术优势源于其全模态布局,不仅在语音领域领先,还推出了首个大规模线性注意力机制的文本大模型,并开源了MiniMax-Text-01和MiniMax-VL-01。未来,MiniMax将继续引领“模型即产品”的发展趋势,为行业带来更多可能性。
原文链接
本文链接:https://kx.umi6.com/article/18698.html
转载请注明文章出处
相关推荐
.png)
换一换
聊透Agent,它是“同事”还是“工具”,创业机会和价值究竟是什么?
2025-06-13 16:14:41
前百川联创焦可新创业公司曝光,新项目已上线 App Store
2025-07-11 18:43:26
大模型公司挖墙脚哪家强?
2025-06-05 14:50:54
435 文章
64695 浏览
24小时热文
更多

-
2025-07-20 08:01:35
-
2025-07-19 22:57:32
-
2025-07-19 21:58:20