1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:超越OpenAI、拿下全球双料第一,“AI吴彦祖”背后大模型SOTA了!

正文:
超越OpenAI!国产大模型MiniMax最新发布的Speech-02一举拿下Artificial Analysis Speech Arena和Hugging Face TTS Arena两项全球权威语音基准测评榜首,成为榜单前十中唯一的国产玩家。

Speech-02的核心亮点在于超拟人、个性化和多样性。它不仅能完美模拟专业播音腔,还能根据文章内容自动调整语气和情绪,中英混杂也不在话下。只需几秒参考语音,即可实现超逼真复刻,且定价仅为ElevenLabs的一半甚至四分之一。

Speech-02支持32种语言,涵盖不同口音、性别和年龄,且可复刻任意音色。通过最少10秒的参考样本,即可完成音色模仿,并支持情绪等细节调整。例如,用霉霉的纽约大学演讲片段生成中文版音色,效果依然出色。

技术上,Speech-02采用自回归Transformer架构,引入可学习说话者编码器,无需参考文本即可实现零样本克隆。同时,基于Flow-VAE的流匹配模型提升了音质和相似性。模型已在教育、智能座舱、AI玩具等多个领域落地,展现了强大的商业潜力。

MiniMax不仅在技术上领先,还通过与高途、极狐汽车等合作,推动AI语音在教育、娱乐等场景的应用。此外,MiniMax还在探索AI玩具、粤语天气预报等新领域,展现其持续创新的能力。

MiniMax的技术优势源于其全模态布局,不仅在语音领域领先,还推出了首个大规模线性注意力机制的文本大模型,并开源了MiniMax-Text-01和MiniMax-VL-01。未来,MiniMax将继续引领“模型即产品”的发展趋势,为行业带来更多可能性。

原文链接
本文链接:https://kx.umi6.com/article/18698.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
聊透Agent,它是“同事”还是“工具”,创业机会和价值究竟是什么?
2025-06-13 16:14:41
前百川联创焦可新创业公司曝光,新项目已上线 App Store
2025-07-11 18:43:26
大模型公司挖墙脚哪家强?
2025-06-05 14:50:54
24小时热文
更多
扫一扫体验小程序