阿里云于1月29日宣布其通义千问Qwen 2.5-Max超大规模MoE模型在多项基准测试中超越DeepSeek V3等对手。Qwen2.5-Max在Chatbot Arena盲测中以1332分位列全球第七,成为非推理类中国大模型冠军。尤其在数学和编程能力上,Qwen2.5-Max排名榜首,硬提示方面排名第二。Chatbot Arena由LMSYS Org推出,是业界公认最公正权威的大模型榜单之一。阿里云表示,Qwen2.5-Max在Arena-Hard、LiveBench、LiveCodeBench等测试中表现优异,几乎全面超越GPT-4o、DeepSeek-V3及Llama-3.1-405B。
原文链接
本文链接:https://kx.umi6.com/article/12641.html
转载请注明文章出处
相关推荐
换一换
阿里云宣布通义完成安全升级
2025-09-25 18:09:38
大模型开始打王者荣耀了
2025-09-02 12:31:33
吴泳铭23分钟演讲,让阿里涨了2200亿
2025-09-24 16:45:41
豆包们,开始「上链接」
2025-10-27 10:54:08
易点天下与阿里云达成全面深化合作,加速助力中国企业出海服务与智能营销发展
2025-08-11 12:01:15
AI与汽车加速融合 阿里云全栈AI已支撑全部中国车企!
2025-09-25 17:07:45
阿里云2026财年Q2营收激增34%:AI收入连续9个季度三位数增长
2025-11-25 20:05:22
西部证券:模型端正在演化为“开源阿里、闭源谷歌”的两极强化
2025-11-24 08:47:19
人类正在被AI「幻觉」欺骗
2025-08-20 10:10:57
“雷军千万年薪要挖”的 DeepSeek 罗福莉官宣加入小米 Xiaomi MiMo 大模型团队
2025-11-12 14:05:32
把12个AI凑到一起打工,它们竟然搞起“小团体”?
2025-10-16 22:02:39
王兴一鸣惊人!美团首个开源大模型追平DeepSeek-V3.1
2025-09-01 13:16:16
Ilya罕见发声:大模型「大力出奇迹」到头了
2025-11-26 09:32:32
581 文章
342470 浏览
24小时热文
更多
-
2025-12-08 21:51:18 -
2025-12-08 21:49:12 -
2025-12-08 21:48:42