综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
东南大学基于昇腾国产算力平台接入阿里开源模型QwQ-32B,成为全国首个上线该服务的高校。QwQ-32B参数量虽小,但在多项任务中表现媲美甚至超越671B参数的DeepSeek-R1。该模型支持消费级显卡本地部署,降低了硬件门槛,有助于师生在科研中快速实现AI推理需求。东南大学表示,QwQ-32B集成工具调用与动态推理能力,适用于复杂科研任务。3月10日更新。
原文链接
3月9日,国家超算互联网平台宣布上线阿里巴巴开源推理模型QwQ-32B的API接口服务,用户可免费获得100万Tokens。QwQ-32B基于Qwen2.5-32B+强化学习构建,在AIME24和LiveCodeBench评测中表现优异。平台全面适配QwQ-32B,包括vLLM、PyTorch推理适配,用户可一键启动Notebook功能进行开发或私有化部署。此外,平台还提供DeepSeek-R1全家桶及多种AI模型服务。目前,超算互联网已连接全国14个省份的20多家超算和智算中心,提供超过6500款算力商品。
原文链接
阿里云于3月6日推出最新推理模型QwQ-32B,该模型仅320亿参数即可媲美参数达6710亿的DeepSeek-R1。QwQ-32B在数学推理、编程及通用能力测试中表现优异,超越了包括DeepSeek-R1在内的多个领先模型。此模型已在Hugging Face和ModelScope开源,并集成Agent相关能力,支持批判性思考和环境反馈调整。阿里云表示,这是Qwen在强化学习增强推理能力的第一步,未来将探索更强大的基础模型与RL的结合,目标是实现人工通用智能(AGI)。
原文链接
加载更多
暂无内容