阿里除夕发布Qwen2.5-Max反超DeepSeek V3，一句话开发小游戏

2025-01-29 12:07:57

心智奇点

发布在

科普

阅读：538

阿里在除夕夜发布了Qwen2.5-Max，这款模型在多个基准测试中超越了DeepSeek V3。Qwen2.5-Max在Arena-Hard、LiveBench、LiveCodeBench、GPQA-Diamond等基准测试中表现出色，整体优于DeepSeek V3、Llama-3.1-405B及闭源模型GPT-4o，与Claude-3.5-Sonnet相比也不逊色。

Qwen2.5-Max是超大规模的MoE模型，经过超过20万亿token的预训练数据及精心设计的SFT+RLHF训练方案训练而成。它在MMLU-Pro等基准测试中同样超越了DeepSeek V3和Llama-3.1-405B，展示了其强大的知识理解和推理能力。

该模型具备联网搜索、代码生成和Artifacts功能，能够快速生成如旋转球体、扫雷游戏等应用。Qwen2.5-Max现已在Qwen Chat中上线，并提供Hugging Face Demo、Any Chat和阿里云API供用户使用。

阿里研究员们也在模型发布后积极推广，表达对用户的祝福。

原文链接

本文链接：https://kx.umi6.com/article/12335.html

转载请注明文章出处

DeepSeek V3