1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

2025年高考已结束,但数学科目难度引发持续讨论。《每日经济新闻》测评了DeepSeek-R1、腾讯混元T1、Grok3等十款AI大模型,使用2025年全国新课标数学I卷。国产模型DeepSeek-R1与腾讯混元T1以零错误并列第一,得分117分;讯飞星火X1以112分紧随其后。Grok3表现不佳,仅获91分,排名倒数第三,因无法正确理解多选题。智谱清言推理模式得78分,位列倒数第二。Kimi k1.5垫底,压轴题失误严重。测评显示,AI在固定逻辑题上能力强,但在创新思维题上仍有局限。

原文链接
本文链接:https://kx.umi6.com/article/20015.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
AI刷题强到可怕?挑战高考数学卷,DeepSeek-R1、腾讯混元T1、Grok3等十大模型测评来了
2025-06-11 00:56:16
12个国产大模型大战高考数学,意外炸出个大bug
2024-06-08 14:24:10
最新一期权威大模型榜单:豆包1.5、商汤日日新V6并列国内第一
2025-05-30 16:55:41
鸿海富士康申请注册旗下首款 AI 推理大模型“FoxBrain”商标,当前状态“等待实质审查”
2025-07-02 13:40:15
七家主流大模型挑战 2025 高考数学:仅 DeepSeek、讯飞星火得分超 140
2025-06-08 18:10:10
Deep Research类产品深度测评:下一个大模型产品跃迁点到来了吗?
2025-04-22 12:18:27
鸿海精密工业股份有限公司申请注册AI推理大模型商标
2025-07-02 12:38:31
谷歌放大招!Gemini「吞下」2.5亿地图数据,路痴AI一夜成精
2025-10-24 11:33:27
前三季度规模以上机械工业增加值同比增长8.7% 工业机器人产量超上年全年
2025-10-24 15:43:29
Anthropic确认与谷歌云达成价值数百亿美元的合作协议
2025-10-24 05:23:38
字节跳动推出3D生成大模型
2025-10-23 16:11:27
OpenAI 预告“AI 浏览器”ChatGPT Atlas 未来更新:标签组、广告拦截器等
2025-10-24 09:30:10
100 万块 TPU、1GW 容量,Anthropic 与谷歌云正式达成百亿美元算力合作
2025-10-24 10:33:37
24小时热文
更多
扫一扫体验小程序