阿里云于1月29日宣布其通义千问Qwen 2.5-Max超大规模MoE模型在多项基准测试中超越DeepSeek V3等对手。Qwen2.5-Max在Chatbot Arena盲测中以1332分位列全球第七,成为非推理类中国大模型冠军。尤其在数学和编程能力上,Qwen2.5-Max排名榜首,硬提示方面排名第二。Chatbot Arena由LMSYS Org推出,是业界公认最公正权威的大模型榜单之一。阿里云表示,Qwen2.5-Max在Arena-Hard、LiveBench、LiveCodeBench等测试中表现优异,几乎全面超越GPT-4o、DeepSeek-V3及Llama-3.1-405B。
原文链接
本文链接:https://kx.umi6.com/article/12641.html
转载请注明文章出处
相关推荐
换一换
阿里云发布函数计算AgentRun
2025-12-10 18:06:19
阶跃星辰杀入季后赛,强势跻身AI“新六小虎”第一梯队
2026-02-27 15:48:37
阿里云刘伟光:2026 年初将看到 AI 应用的再一次爆发
2025-12-31 22:43:50
开源模型TOP5,被中国厂商包圆了
2025-10-15 17:36:49
阿里字节腾讯,集体重仓新风口
2025-10-17 14:18:54
西部证券:模型端正在演化为“开源阿里、闭源谷歌”的两极强化
2025-11-24 08:47:19
ToC智能体火得快,但更大的价值在企业丨中关村科金@MEET2026
2025-12-12 14:53:17
破局算力浪费 阿里云AI成果入选顶会 GPU用量削减82%
2025-10-18 22:39:35
阿里CEO吴泳铭:阿里云AI服务器上架节奏“严重跟不上订单增速”
2025-11-25 22:10:41
服务器严重跟不上订单增速 阿里CEO:3年内不太可能有AI泡沫
2025-11-25 23:12:52
DeepSeek V3.2、GLM4.6等大模型即将发布
2025-09-29 17:14:30
李开复任命三位新高管:零一万物的“一把手工程”与大模型中场战事
2025-10-27 13:00:52
Manus救不了Meta
2026-01-08 20:35:12
634 文章
445880 浏览
24小时热文
更多
-
2026-03-09 21:13:27 -
2026-03-09 20:09:26 -
2026-03-09 20:09:18