阿里云于1月29日宣布其通义千问Qwen 2.5-Max超大规模MoE模型在多项基准测试中超越DeepSeek V3等对手。Qwen2.5-Max在Chatbot Arena盲测中以1332分位列全球第七,成为非推理类中国大模型冠军。尤其在数学和编程能力上,Qwen2.5-Max排名榜首,硬提示方面排名第二。Chatbot Arena由LMSYS Org推出,是业界公认最公正权威的大模型榜单之一。阿里云表示,Qwen2.5-Max在Arena-Hard、LiveBench、LiveCodeBench等测试中表现优异,几乎全面超越GPT-4o、DeepSeek-V3及Llama-3.1-405B。
原文链接
本文链接:https://kx.umi6.com/article/12641.html
转载请注明文章出处
相关推荐
换一换
清华孙茂松:对工业界而言,大厂可以Scaling,其他玩家重在垂直应用 | MEET2026
2025-12-21 10:35:20
几乎都在挂羊头卖狗肉!AI Agent泡沫实在太大了
2025-10-20 11:04:42
阿里发布电影级视频模型万相2.6
2025-12-16 13:40:51
阿里云百炼官宣通义千问3-Max模型降价
2025-11-13 23:26:41
大模型即OS,AI云即计算机:阿里的全栈赌注
2025-09-25 10:00:29
啊?微博7800美元训的大模型,数学能力超了DeepSeek-R1
2025-11-18 14:20:39
从 CIPS & CLM 迈进:中国大模型的智能跃迁
2025-10-30 17:51:34
智谱AI今日正式上市,一文讲透你想知道的6件事
2026-01-09 21:35:10
阿里云发布多模态交互开发套件 可应用于AI眼镜、机器人等
2026-01-08 12:17:50
阿里吴泳铭:积极推进3800亿的AI基础设施建设 并计划追加更大的投入
2025-09-24 10:37:46
阿里巴巴CEO吴泳铭:大模型是下一代操作系统 AI Cloud是下一代计算机
2025-09-24 10:37:04
股价暴涨背后,阿里和百度的野心都藏不住了!
2025-09-28 08:50:42
刚刚,智谱港交所敲钟!市值528亿港元
2026-01-08 11:04:01
613 文章
404140 浏览
24小时热文
更多
-
2026-01-23 00:20:44 -
2026-01-22 23:18:34 -
2026-01-22 23:17:29