1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
难上热搜的高考数学,我拿ChatGPT和豆包PK了一把!
【AI迎战2026高考数学!豆包PK ChatGPT结果出炉】今年高考数学因计算量大、题型新引发热议。若把试卷交给AI会怎样?近日,测试者使用图像输入,让“豆包思考模式”与“ChatGPT(GPT-5.5)”进行实测PK。结果显示,两者在单选和填空题上全部答对,面对多选及解答压轴题也能给出完整推导,表现稳定。测试表明,开启思考模式的头部AI已具备较强解题能力,能稳定读题、拆解条件并验证步骤。不过复杂长链条任务仍需人工复核。AI正进化为高质量的解题陪练,如何将其转化为学习工具而非抄答案神器,是接下来的重要课题。
数码游侠
06-08 17:37:12
分享至
打开微信扫一扫
内容投诉
生成图片
AI刷题强到可怕?挑战高考数学卷,DeepSeek-R1、腾讯混元T1、Grok3等十大模型测评来了
2025年高考已结束,但数学科目难度引发持续讨论。《每日经济新闻》测评了DeepSeek-R1、腾讯混元T1、Grok3等十款AI大模型,使用2025年全国新课标数学I卷。国产模型DeepSeek-R1与腾讯混元T1以零错误并列第一,得分117分;讯飞星火X1以112分紧随其后。Grok3表现不佳,仅获91分,排名倒数第三,因无法正确理解多选题。智谱清言推理模式得78分,位列倒数第二。Kimi k1.5垫底,压轴题失误严重。测评显示,AI在固定逻辑题上能力强,但在创新思维题上仍有局限。
月光编码师
06-11 00:56:16
分享至
打开微信扫一扫
内容投诉
生成图片
七家主流大模型挑战 2025 高考数学:仅 DeepSeek、讯飞星火得分超 140
2025年高考正在进行,数学试卷引发热议。多家主流大模型挑战高考数学,DeepSeek和讯飞星火得分超140分,位列第一梯队。DeepSeek以143分居首,讯飞星火141分紧随其后。GPT o3获138分排名第三。测试显示,AI数学能力较去年有显著提升,但DeepSeek存在OCR识别错误及推理速度慢的问题,讯飞星火则基于国产算力平台实现高效准确。此测试旨在探索AI在教育领域的应用潜力,推动AI与教学实践深度融合。
跨界思维
06-08 18:10:10
分享至
打开微信扫一扫
内容投诉
生成图片
12个国产大模型大战高考数学,意外炸出个大bug
中国多个国产大模型挑战高考数学,包括Kimi、通义千问等12款AI,尝试解答高考数学选择题与大题。测试中,AI在识别图像环节遇到困难,许多模型无法生成答案。其中,GPT-4o暂未参与全部试题。测试显示,识图及解题能力上存在差距。报告同时提供了AI智能助手的最新用户数据分析。这是一次科技与教育的实时碰撞,引发了关于AI在实际应用中的效能讨论。
QuantumHacker
06-08 14:24:10
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序