阿里推出的Qwen2.5-Max在大模型竞技场榜单上超越DeepSeek-V3,以总分1332位列第七,同时超过Claude 3.5 Sonnet和Llama 3.1 405B等模型。该模型在编程和数学方面尤为突出,与满血o1及DeepSeek-R1并列第一。Chatbot Arena是全球顶级大模型的权威测试平台,Qwen2.5-Max在WebDev榜单上也进入前十。官方认为,这表明中国AI正在快速缩小差距。
网友反馈称Qwen2.5-Max表现稳定,且可能很快取代硅谷的普通模型。在具体单项能力中,Qwen2.5-Max在数学和代码任务上与满血o1及DeepSeek-R1并列第一,胜率高达69%。在复杂提示词任务中,Qwen2.5-Max表现优异,多轮对话能力和长文本处理能力同样出色。在开源基座模型对比中,Qwen2.5-Max也全面领先。
Qwen2.5-Max还展示了强大的代码生成和推理能力,例如生成一个象棋游戏和旋转球体图像,以及解决复杂的推理问题。该模型已在Qwen Chat平台上线,供免费体验。
原文链接
本文链接:https://kx.umi6.com/article/12547.html
转载请注明文章出处
相关推荐
换一换
华泰证券:AI推动机床、工控等顺周期景气提升
2026-05-13 09:06:29
60%用户还在乱养虾!9位大神亮招:有人多赚一笔钱,有人多睡1小时|量子位沙龙
2026-03-30 12:44:57
祖国人公开反对AI!称AI打心底反感人类
2026-06-07 14:40:43
北京备案大模型达225款 占全国总量约三成
2026-04-22 20:27:12
中信建投:机器人是AI最好的物理载体之一 看好板块行情演绎
2026-05-27 08:19:53
腾讯:下半年AI相关的资本支出会进一步增加
2026-05-13 22:04:24
Meta大重组:裁员同时转岗 7000人将加入AI新团队
2026-05-20 12:35:01
HALO交易站上风口 机构掘金A股确定性机会
2026-03-16 07:36:41
OpenClaw火出天际 工程院院士王坚:AI龙虾价格很快打下来
2026-03-08 19:34:04
谷歌CEO承认Coding落后了
2026-05-24 14:40:24
亚马逊预计未来十年AI将助力AWS年销售额达6000亿美元
2026-03-18 08:59:05
AI正加速劣质假新闻传播 詹姆斯发声吐槽:你们觉得呢
2026-06-08 10:19:48
大模型收入暴涨1076%,港股AGI第一股首份年报:一年狂揽12亿,属实把商业化玩明白了
2026-03-27 17:08:13
726 文章
662855 浏览
24小时热文
更多
-
2026-06-09 07:06:40 -
2026-06-09 00:54:40 -
2026-06-09 00:53:08