1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

阿里在除夕夜发布了Qwen2.5-Max,这款模型在多个基准测试中超越了DeepSeek V3。Qwen2.5-Max在Arena-Hard、LiveBench、LiveCodeBench、GPQA-Diamond等基准测试中表现出色,整体优于DeepSeek V3、Llama-3.1-405B及闭源模型GPT-4o,与Claude-3.5-Sonnet相比也不逊色。

Qwen2.5-Max是超大规模的MoE模型,经过超过20万亿token的预训练数据及精心设计的SFT+RLHF训练方案训练而成。它在MMLU-Pro等基准测试中同样超越了DeepSeek V3和Llama-3.1-405B,展示了其强大的知识理解和推理能力。

该模型具备联网搜索、代码生成和Artifacts功能,能够快速生成如旋转球体、扫雷游戏等应用。Qwen2.5-Max现已在Qwen Chat中上线,并提供Hugging Face Demo、Any Chat和阿里云API供用户使用。

阿里研究员们也在模型发布后积极推广,表达对用户的祝福。

原文链接
本文链接:https://kx.umi6.com/article/12335.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
o3-pro通关“推箱子”,人类怀旧小游戏成了大模型新Benchmark
2025-06-17 13:23:27
豆包编程能力升级:支持 HTML 代码实时预览、交互,号称 3 分钟做出专属小游戏
2025-03-19 22:54:11
阿里将推出基于 Qwen2.5-MAX 的深度推理模型
2025-02-20 21:26:21
网友疯玩谷歌 Gemini 3:数字拍立得、复刻小游戏,AI 造物 0 门槛
2025-11-20 14:26:06
DeepSeek 丢了开源第一王座,但继任者“Kimi K2”依然来自中国
2025-07-18 18:42:56
DeepSeek V3 和 R1 模型完成海光 DCU 国产化适配并正式上线
2025-02-04 14:35:48
「小白」跑步入场小游戏
2025-03-24 16:04:08
阿里除夕发布Qwen2.5-Max反超DeepSeek V3,一句话开发小游戏
2025-01-29 12:07:57
被认为国产AI之光的DeepSeek V3出糗:居然自称是ChatGPT
2024-12-30 01:03:43
杭州超越杭州:阿里Qwen2.5-Max反超DeepSeek-V3!网友:中国AI正在快速缩小差距
2025-02-04 20:42:25
国产AI大模型之光DeepSeek把AI大佬全炸出来了!6710亿参数训练只需1/10算力
2024-12-27 14:05:57
DeepSeek V3 引发AI路径之辩:从“鹦鹉学舌”到“乌鸦喝水”?
2025-01-02 11:15:16
中信证券:DeepSeek V3发布,加速AI应用落地
2024-12-30 09:14:50
24小时热文
更多
扫一扫体验小程序