阿里云于3月6日推出最新推理模型QwQ-32B,该模型仅320亿参数即可媲美参数达6710亿的DeepSeek-R1。QwQ-32B在数学推理、编程及通用能力测试中表现优异,超越了包括DeepSeek-R1在内的多个领先模型。此模型已在Hugging Face和ModelScope开源,并集成Agent相关能力,支持批判性思考和环境反馈调整。阿里云表示,这是Qwen在强化学习增强推理能力的第一步,未来将探索更强大的基础模型与RL的结合,目标是实现人工通用智能(AGI)。
原文链接
本文链接:https://kx.umi6.com/article/14886.html
转载请注明文章出处
相关推荐
换一换
百望股份阿里云推出首个垂类MCP服务,强强联合领跑数据智能赛道
2025-05-07 12:07:33
硅基流动新获阿里领投数亿元融资
2025-06-09 19:35:13
阿里云推出最新通义千问 QwQ-32B 推理模型,仅 1/20 参数媲美 DeepSeek R1
2025-03-06 07:44:39
零跑 B10 汽车内置 DeepSeek + 通义千问模型,3 月 10 日预售
2025-02-26 10:30:18
阿里CEO吴泳铭:加速打造全球云计算一张网 支持中企出海
2025-05-22 10:25:59
阿里据称将为中国iPhone开发AI功能 通义千问产业链或迎重磅催化
2025-02-12 08:25:29
AI火花集|10位AI火花先锋揭晓,看AI应用如何“改写”商业世界?
2025-04-17 17:42:55
性能比肩 Gemini-2.5 pro、o4-mini:阿里通义千问 Qwen 3 推理模型超级进化,现已开源
2025-07-26 00:31:49
阿里据悉秘密研发新模型Qwen3将发布 官方暂无回应
2025-04-01 16:35:21
独家|阿里云启动“T项目” 加速AI研发
2025-03-17 14:46:39
阿里云百炼上线全尺寸 DeepSeek 模型,1 元最高可享受 200 万 tokens
2025-02-09 15:47:21
阿里吴泳铭:正在推进三年3800亿AI基建计划,并将会追加更大的投入
2025-09-24 12:39:34
阿里云将在韩国启用第二座数据中心 满足生成式AI需求
2025-06-19 10:50:10
540 文章
255723 浏览
24小时热文
更多
-
2025-10-24 09:34:47 -
2025-10-24 09:33:43 -
2025-10-24 09:32:35