高考数学 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

难上热搜的高考数学，我拿ChatGPT和豆包PK了一把！

【AI迎战2026高考数学！豆包PK ChatGPT结果出炉】今年高考数学因计算量大、题型新引发热议。若把试卷交给AI会怎样？近日，测试者使用图像输入，让“豆包思考模式”与“ChatGPT(GPT-5.5)”进行实测PK。结果显示，两者在单选和填空题上全部答对，面对多选及解答压轴题也能给出完整推导，表现稳定。测试表明，开启思考模式的头部AI已具备较强解题能力，能稳定读题、拆解条件并验证步骤。不过复杂长链条任务仍需人工复核。AI正进化为高质量的解题陪练，如何将其转化为学习工具而非抄答案神器，是接下来的重要课题。

原文链接

数码游侠

06-08 17:37:12

分享至

打开微信扫一扫

内容投诉

生成图片

AI刷题强到可怕？挑战高考数学卷，DeepSeek-R1、腾讯混元T1、Grok3等十大模型测评来了

2025年高考已结束，但数学科目难度引发持续讨论。《每日经济新闻》测评了DeepSeek-R1、腾讯混元T1、Grok3等十款AI大模型，使用2025年全国新课标数学I卷。国产模型DeepSeek-R1与腾讯混元T1以零错误并列第一，得分117分；讯飞星火X1以112分紧随其后。Grok3表现不佳，仅获91分，排名倒数第三，因无法正确理解多选题。智谱清言推理模式得78分，位列倒数第二。Kimi k1.5垫底，压轴题失误严重。测评显示，AI在固定逻辑题上能力强，但在创新思维题上仍有局限。

原文链接

月光编码师

06-11 00:56:16

分享至

打开微信扫一扫

内容投诉

生成图片

七家主流大模型挑战 2025 高考数学：仅 DeepSeek、讯飞星火得分超 140

2025年高考正在进行，数学试卷引发热议。多家主流大模型挑战高考数学，DeepSeek和讯飞星火得分超140分，位列第一梯队。DeepSeek以143分居首，讯飞星火141分紧随其后。GPT o3获138分排名第三。测试显示，AI数学能力较去年有显著提升，但DeepSeek存在OCR识别错误及推理速度慢的问题，讯飞星火则基于国产算力平台实现高效准确。此测试旨在探索AI在教育领域的应用潜力，推动AI与教学实践深度融合。

原文链接

跨界思维

06-08 18:10:10

分享至

打开微信扫一扫

内容投诉

生成图片

12个国产大模型大战高考数学，意外炸出个大bug

中国多个国产大模型挑战高考数学，包括Kimi、通义千问等12款AI，尝试解答高考数学选择题与大题。测试中，AI在识别图像环节遇到困难，许多模型无法生成答案。其中，GPT-4o暂未参与全部试题。测试显示，识图及解题能力上存在差距。报告同时提供了AI智能助手的最新用户数据分析。这是一次科技与教育的实时碰撞，引发了关于AI在实际应用中的效能讨论。

原文链接