1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

阿里云于1月29日发布了全新超大规模MoE模型通义千问Qwen 2.5-Max。该模型采用超过20万亿token的预训练数据及后训练方案。据阿里云公布的数据,在Arena-Hard、LiveBench等基准测试中,Qwen 2.5-Max的表现优于DeepSeek V3,并在MMLU-Pro等评估中展现出竞争力。此外,在基座模型对比中,Qwen 2.5-Max在多数基准测试中优于DeepSeek V3、Llama-3.1-405B等开源模型。Qwen 2.5-Max尚未开源。

原文链接
本文链接:https://kx.umi6.com/article/12319.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
已读乱回的AI客服,逼疯当代人
2025-02-14 22:48:27
英伟达黄仁勋盛赞 AI 行业变革速度惊人:过去 10 年进步了 100 万倍
2025-06-11 10:06:07
支付宝推出减肥人士“AI搭子”:“减重专区”带你科学吃、健康练
2025-05-07 13:10:31
24小时热文
更多
扫一扫体验小程序