2024年底,国产大模型在2025考研数学测试中表现亮眼,Kimi视觉思考版和DeepSeek分别获得了133分和103.5分,突破百分大关。相比6月高考数学成绩,此次测试中大模型普遍进步显著,通义得分90分,豆包和智谱均为88.5分。测试结果显示,大模型在数理逻辑方面取得进展,但仍需提升,特别是在复杂题目上的表现。Kimi和DeepSeek的进步尤为突出,展现了较强的解题思路和步骤。然而,部分模型在某些难题上仍存在问题,显示其能力仍有提升空间。
原文链接
本文链接:https://kx.umi6.com/article/10837.html
转载请注明文章出处
相关推荐
换一换
MEET2026挤爆了,AI圈今年最该听的20+场演讲&对谈都在这
2025-12-11 15:57:49
Ilya罕见发声:大模型「大力出奇迹」到头了
2025-11-26 09:32:32
开源模型TOP5,被中国厂商包圆了
2025-10-15 17:36:49
「今年业务是去年5倍以上」,工业智能体掀热潮
2025-08-29 12:38:30
开源 AI 模型 TOP5,被中国厂商包圆
2025-10-15 18:39:57
大厂「AI」智能体,等待 DeepSeek 时刻
2025-07-31 11:05:08
人类正在被AI「幻觉」欺骗
2025-08-20 10:10:57
大模型驱动算力革命 AI芯片迎破局新机遇
2025-09-18 07:47:51
大模型开始打王者荣耀了
2025-09-02 12:31:33
卖酒的茅台要学AI了!和奔驰麦当劳一起拜师百度
2025-08-17 12:35:45
讯飞星火 X1 升级版模型宣布上线:整体效果对标 OpenAI o3 等国内外一流大模型
2025-07-25 14:25:03
中国企业调用大模型日均超10万亿Tokens
2025-09-01 12:17:48
Gartner首次发布大模型报告:火山引擎排名中国厂商第一
2025-11-20 12:17:36
577 文章
337491 浏览
24小时热文
更多
-
2025-12-13 15:58:26 -
2025-12-13 15:57:18 -
2025-12-13 15:56:11