
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
标题:国产大模型“考研数学”成绩单出炉,哪家AI能上岸?
日前,清华大学人工智能研究院基础模型研究中心团队晒出了国内外13个模型(包括基础模型和深度推理模型)在2025年考研数学(一、二、三)上的成绩。结果显示,OpenAI o1 最强,但对国产头部模型(如GLM-zero-preview、QwQ)...
原文链接
智谱官方于12月31日发布了GLM-Zero预览版,这是首个基于扩展强化学习技术训练的推理模型。该模型专长于数理逻辑、代码及复杂问题的深度推理。在AIME 2024、MATH500和LiveCodeBench评测中,GLM-Zero-Preview的表现与OpenAI o1-preview相当。以2025年考研数学一为例,GLM-Zero-Preview获得了126分。尽管目前与OpenAI的o3模型仍有差距,但官方表示将持续优化。GLM-Zero-Preview已上线,体验地址包括智谱清言和智谱开放平台。
原文链接
2024年底,国产大模型在2025考研数学测试中表现亮眼,Kimi视觉思考版和DeepSeek分别获得了133分和103.5分,突破百分大关。相比6月高考数学成绩,此次测试中大模型普遍进步显著,通义得分90分,豆包和智谱均为88.5分。测试结果显示,大模型在数理逻辑方面取得进展,但仍需提升,特别是在复杂题目上的表现。Kimi和DeepSeek的进步尤为突出,展现了较强的解题思路和步骤。然而,部分模型在某些难题上仍存在问题,显示其能力仍有提升空间。
原文链接
11月1日,夸克宣布升级“AI搜题”产品,并发布“灵知”学习大模型。用户可通过多种设备搜题,AI将分步骤讲解题目并支持随时提问。“灵知”大模型针对题目中的知识点进行深度讲解,帮助用户举一反三。最新评测显示,“灵知”在考研数学题上的正确率和得分率已接近OpenAI的o1模型。此外,夸克在今年7月已升级“超级搜索框”,提供从检索、创作、总结到编辑、存储、分享的一体化信息服务。此次升级进一步提升了夸克在AI教育领域的竞争力。
原文链接
加载更多

暂无内容