考研数学 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

国产大模型“考研数学”成绩单出炉，哪家AI能上岸？

标题：国产大模型“考研数学”成绩单出炉，哪家AI能上岸？日前，清华大学人工智能研究院基础模型研究中心团队晒出了国内外13个模型（包括基础模型和深度推理模型）在2025年考研数学（一、二、三）上的成绩。结果显示，OpenAI o1 最强，但对国产头部模型（如GLM-zero-preview、QwQ）...

原文链接

智能维度跳跃

01-14 20:18:21

国产大模型

考研数学

分享至

打开微信扫一扫

内容投诉

生成图片

2025 年考研数学一得 126 分，智谱深度推理模型 GLM-Zero 预览版上线

智谱官方于12月31日发布了GLM-Zero预览版，这是首个基于扩展强化学习技术训练的推理模型。该模型专长于数理逻辑、代码及复杂问题的深度推理。在AIME 2024、MATH500和LiveCodeBench评测中，GLM-Zero-Preview的表现与OpenAI o1-preview相当。以2025年考研数学一为例，GLM-Zero-Preview获得了126分。尽管目前与OpenAI的o3模型仍有差距，但官方表示将持续优化。GLM-Zero-Preview已上线，体验地址包括智谱清言和智谱开放平台。

原文链接

智慧轨迹

12-31 18:45:44

GLM-Zero-Preview

推理模型

考研数学一

分享至

打开微信扫一扫

内容投诉

生成图片

国产大模型2025考研数学排行榜：仅前两名成绩破百

2024年底，国产大模型在2025考研数学测试中表现亮眼，Kimi视觉思考版和DeepSeek分别获得了133分和103.5分，突破百分大关。相比6月高考数学成绩，此次测试中大模型普遍进步显著，通义得分90分，豆包和智谱均为88.5分。测试结果显示，大模型在数理逻辑方面取得进展，但仍需提升，特别是在复杂题目上的表现。Kimi和DeepSeek的进步尤为突出，展现了较强的解题思路和步骤。然而，部分模型在某些难题上仍存在问题，显示其能力仍有提升空间。

原文链接

虚拟织梦者

12-27 11:00:22

大模型

考研数学

逻辑思维

分享至

打开微信扫一扫

内容投诉

生成图片

夸克发布“灵知”学习大模型，号称考研数学题正确率、得分率比肩 OpenAI o1

11月1日，夸克宣布升级“AI搜题”产品，并发布“灵知”学习大模型。用户可通过多种设备搜题，AI将分步骤讲解题目并支持随时提问。“灵知”大模型针对题目中的知识点进行深度讲解，帮助用户举一反三。最新评测显示，“灵知”在考研数学题上的正确率和得分率已接近OpenAI的o1模型。此外，夸克在今年7月已升级“超级搜索框”，提供从检索、创作、总结到编辑、存储、分享的一体化信息服务。此次升级进一步提升了夸克在AI教育领域的竞争力。

原文链接