阿里在除夕夜发布了Qwen2.5-Max,这款模型在多个基准测试中超越了DeepSeek V3。Qwen2.5-Max在Arena-Hard、LiveBench、LiveCodeBench、GPQA-Diamond等基准测试中表现出色,整体优于DeepSeek V3、Llama-3.1-405B及闭源模型GPT-4o,与Claude-3.5-Sonnet相比也不逊色。
Qwen2.5-Max是超大规模的MoE模型,经过超过20万亿token的预训练数据及精心设计的SFT+RLHF训练方案训练而成。它在MMLU-Pro等基准测试中同样超越了DeepSeek V3和Llama-3.1-405B,展示了其强大的知识理解和推理能力。
该模型具备联网搜索、代码生成和Artifacts功能,能够快速生成如旋转球体、扫雷游戏等应用。Qwen2.5-Max现已在Qwen Chat中上线,并提供Hugging Face Demo、Any Chat和阿里云API供用户使用。
阿里研究员们也在模型发布后积极推广,表达对用户的祝福。
原文链接
本文链接:https://kx.umi6.com/article/12335.html
转载请注明文章出处
相关推荐
.png)
换一换
谷歌回应 AI 搜索生成重大事实错误内容:建议网友吃石头、毒蘑菇等
2024-05-25 09:22:14
高考语文作文首次遇上 AI:2024 新课标 I 卷谈“AI 时代问题是否会越来越少”
2024-06-07 13:01:40
比尔·盖茨认证的AI领域最牛大佬,发布新20年的AI预言
2024-10-28 11:22:17
384 文章
45670 浏览
24小时热文
更多

-
2025-07-18 23:46:25
-
2025-07-18 22:47:06
-
2025-07-18 22:46:21