1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:超越OpenAI、拿下全球双料第一,“AI吴彦祖”背后大模型SOTA了!

正文:
超越OpenAI!国产大模型MiniMax最新发布的Speech-02一举拿下Artificial Analysis Speech Arena和Hugging Face TTS Arena两项全球权威语音基准测评榜首,成为榜单前十中唯一的国产玩家。

Speech-02的核心亮点在于超拟人、个性化和多样性。它不仅能完美模拟专业播音腔,还能根据文章内容自动调整语气和情绪,中英混杂也不在话下。只需几秒参考语音,即可实现超逼真复刻,且定价仅为ElevenLabs的一半甚至四分之一。

Speech-02支持32种语言,涵盖不同口音、性别和年龄,且可复刻任意音色。通过最少10秒的参考样本,即可完成音色模仿,并支持情绪等细节调整。例如,用霉霉的纽约大学演讲片段生成中文版音色,效果依然出色。

技术上,Speech-02采用自回归Transformer架构,引入可学习说话者编码器,无需参考文本即可实现零样本克隆。同时,基于Flow-VAE的流匹配模型提升了音质和相似性。模型已在教育、智能座舱、AI玩具等多个领域落地,展现了强大的商业潜力。

MiniMax不仅在技术上领先,还通过与高途、极狐汽车等合作,推动AI语音在教育、娱乐等场景的应用。此外,MiniMax还在探索AI玩具、粤语天气预报等新领域,展现其持续创新的能力。

MiniMax的技术优势源于其全模态布局,不仅在语音领域领先,还推出了首个大规模线性注意力机制的文本大模型,并开源了MiniMax-Text-01和MiniMax-VL-01。未来,MiniMax将继续引领“模型即产品”的发展趋势,为行业带来更多可能性。

原文链接
本文链接:https://kx.umi6.com/article/18698.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
Kimi即将推出新一代万亿大模型:开源王者刷新 去年已超GPT5
2026-01-20 22:33:50
火线解析智谱AI招股书:年营收3亿增速130%,率先冲刺全球大模型第一股
2025-12-19 23:14:23
MiniMax港股IPO公开发售部分获1209倍超额认购
2026-01-06 15:12:09
汪军对话 Rich Sutton:大模型在一定程度上分散了我们对智能理解的注意力
2025-09-28 11:53:51
Manus救不了Meta
2026-01-08 20:35:12
MiniMax把自家“实习生”放出来了!
2026-01-20 22:31:42
1300000000000000!谷歌每月Tokens消耗量曝光(别数了是千万亿)
2025-10-11 09:26:13
人工智能公司 MiniMax 通过港交所聆讯,有望成为“AGI 全球第一股”
2025-12-21 21:01:50
真正的AI竞争力,藏在大模型“后训练”这一步
2025-10-13 16:59:55
李开复任命三位新高管:零一万物的“一把手工程”与大模型中场战事
2025-10-27 13:00:52
开源模型TOP5,被中国厂商包圆了
2025-10-15 17:36:49
消息称腾讯大模型团队架构调整:前 OpenAI 研究员姚顺雨任要职,校招最高 2 倍薪资挖 AI 人才
2025-12-17 17:57:42
“雷军千万年薪要挖”的 DeepSeek 罗福莉官宣加入小米 Xiaomi MiMo 大模型团队
2025-11-12 14:05:32
24小时热文
更多
扫一扫体验小程序