阿里云于1月29日宣布其通义千问Qwen 2.5-Max超大规模MoE模型在多项基准测试中超越DeepSeek V3等对手。Qwen2.5-Max在Chatbot Arena盲测中以1332分位列全球第七,成为非推理类中国大模型冠军。尤其在数学和编程能力上,Qwen2.5-Max排名榜首,硬提示方面排名第二。Chatbot Arena由LMSYS Org推出,是业界公认最公正权威的大模型榜单之一。阿里云表示,Qwen2.5-Max在Arena-Hard、LiveBench、LiveCodeBench等测试中表现优异,几乎全面超越GPT-4o、DeepSeek-V3及Llama-3.1-405B。
原文链接
本文链接:https://kx.umi6.com/article/12641.html
转载请注明文章出处
相关推荐
.png)
换一换
AI 语音爆发的这半年,一位“局中人”看到的赛道爆发逻辑
2025-07-03 12:21:05
2025WAIC:大厂回归,医疗AI爆火出圈
2025-07-30 15:47:42
中国信通院开展面向大模型的全栈国产软硬件系统适配测试工作
2025-07-23 16:55:22
独家|阶跃星辰正进行新一轮融资 金额超5亿美元
2025-07-25 22:31:59
阿里中标工商银行AI编程项目
2025-08-05 15:20:45
上海累计82款大模型通过备案
2025-07-10 11:28:53
当AI智能体走进诊室,大模型如何颠覆医疗?
2025-07-30 13:48:25
阿里云将设立首个AI全球能力中心 并在马来西亚、菲律宾新增数据中心
2025-07-02 10:36:15
卖酒的茅台要学AI了!和奔驰麦当劳一起拜师百度
2025-08-17 12:35:45
三家混战,大模型重回2023
2025-08-03 11:35:50
特想聊聊快手这次的变化
2025-06-25 08:43:51
万字回顾首届中国AI算力大会!15+位大咖主会场演讲精华爆棚,来没来都值得收藏
2025-07-04 14:44:08
数字人,正在逼近盈利线
2025-07-17 12:20:37
470 文章
162049 浏览
24小时热文
更多

-
2025-09-07 21:49:50
-
2025-09-07 20:50:36
-
2025-09-07 20:49:25