综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
7月31日,阿里通义千问发布全新推理模型Qwen3-30B-A3B-Thinking-2507,多项能力显著提升。新模型在数学能力评测AIME25中获85.0高分,代码能力测试LiveCodeBench v6得分66.0,超越Gemini2.5-Flash和Qwen3-235B-A22B。其知识水平、写作、Agent能力、多轮对话及多语言指令遵循等通用能力均表现优异。上下文长度原生支持256K tokens,可扩展至1M tokens,思考长度也增加,适合复杂推理任务。该模型已开源,可在魔搭社区、HuggingFace获取,并支持消费级硬件本地部署,同时上线Qwen Chat平台。
原文链接
7月30日,阿里通义千问宣布推出Qwen3-30B-A3B模型的新版本:Qwen3-30B-A3B-Instruct-2507。该模型为非思考模式(non-thinking mode),长文本理解能力提升至256K,仅激活3B参数即可达到与Gemini 2.5-Flash(non-thinking)和GPT-4o等闭源模型相媲美的性能。这一更新显著优化了模型效率与表现,为开发者和用户提供了更强大的工具支持。
原文链接
加载更多
暂无内容