1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

阿里推出的Qwen2.5-Max在大模型竞技场榜单上超越DeepSeek-V3,以总分1332位列第七,同时超过Claude 3.5 Sonnet和Llama 3.1 405B等模型。该模型在编程和数学方面尤为突出,与满血o1及DeepSeek-R1并列第一。Chatbot Arena是全球顶级大模型的权威测试平台,Qwen2.5-Max在WebDev榜单上也进入前十。官方认为,这表明中国AI正在快速缩小差距。

网友反馈称Qwen2.5-Max表现稳定,且可能很快取代硅谷的普通模型。在具体单项能力中,Qwen2.5-Max在数学和代码任务上与满血o1及DeepSeek-R1并列第一,胜率高达69%。在复杂提示词任务中,Qwen2.5-Max表现优异,多轮对话能力和长文本处理能力同样出色。在开源基座模型对比中,Qwen2.5-Max也全面领先。

Qwen2.5-Max还展示了强大的代码生成和推理能力,例如生成一个象棋游戏和旋转球体图像,以及解决复杂的推理问题。该模型已在Qwen Chat平台上线,供免费体验。

原文链接
本文链接:https://kx.umi6.com/article/12547.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
华尔街掀起“AI抢饭碗”浪潮
2025-10-16 19:00:34
IBM CEO:以现有成本建设AI数据中心“几乎不可能回本”
2025-12-02 21:37:56
当喜剧遇上AI,微博COO王巍与陈佩斯陈大愚父子聊“探索”真义
2025-11-10 17:21:30
肖远企:目前AI在金融领域的应用仍处于早期阶段 无法取代人的决策
2025-10-23 16:12:32
几乎都在挂羊头卖狗肉!AI Agent泡沫实在太大了
2025-10-20 11:04:42
苹果为什么还能赢?
2025-11-03 12:18:58
“雷军千万年薪要挖”的 DeepSeek 罗福莉官宣加入小米 Xiaomi MiMo 大模型团队
2025-11-12 14:05:32
消息称阿里秘密启动“千问”项目,全面对标 ChatGPT
2025-11-13 15:05:16
快手怎么「隐身」了?
2025-12-01 16:19:37
亚马逊云科技发布多款大模型
2025-12-03 14:25:54
AI引爆存储芯片需求!三星Q3营业利润环比猛增160% 股价再创新高
2025-10-30 11:41:52
Take-Two CEO 泽尔尼克:AI 不可能生成一款堪比《GTA》的游戏
2025-10-30 08:29:35
微软 AI 部门 CEO 苏莱曼:我们要开发出能让家长放心给孩子用的 AI
2025-10-24 14:40:25
24小时热文
更多
扫一扫体验小程序