2024年高考来临之际,一场大模型挑战中国高考的测试举行。九个大模型,包括国际和国内知名AI,使用2024年新课标I卷,其中语文作文由教师打分。结果显示,大模型文科表现优异,部分达到一本线,如GPT-4o和豆包,但理科成绩逊色,尤其是数学和理综,多数不及格。英语是大模型的优势科目,平均分132分,但作文写作仍有提升空间。测试揭示了大模型在逻辑推理和情感表达上的局限,文科如历史、政治得分较高,理科尤其是物理和化学面临挑战。此次测试显示,尽管大模型在特定领域如语文和英语有竞争力,但整体而言,它们在数理学科的智力水平仍需提升,距离全面适应高考还有不小差距。
原文链接
本文链接:https://kx.umi6.com/article/2009.html
转载请注明文章出处
相关推荐
换一换
中国中文信息学会2025学术年会暨第二届中国大模型大会(CIPS & CLM 2025)于10月28日在北京盛大开幕
2025-10-30 18:52:50
IDC评测9家座舱大模型产品 斑马获最多项满分推荐
2025-07-18 11:36:59
百度新设两个大模型研发部:直接向CEO李彦宏汇报!
2025-11-25 22:10:22
数字人,正在逼近盈利线
2025-07-17 12:20:37
独家|阶跃星辰正进行新一轮融资 金额超5亿美元
2025-07-25 22:31:59
豆包们,开始「上链接」
2025-10-27 10:54:08
Scaling Law再遭质疑:“退化式AI”竟成终局?
2025-08-04 21:03:25
我国大模型数量超1500个
2025-07-27 23:04:18
DeepSeek新大招曝光:下一步智能体
2025-09-05 10:15:28
「今年业务是去年5倍以上」,工业智能体掀热潮
2025-08-29 12:38:30
蚂蚁密算开源高阶程序HOP框架
2025-07-27 16:06:47
腾讯发布全新大模型混元3D 3.0
2025-09-16 10:11:57
大模型产生幻觉,全怪人类PUA吗?
2025-09-10 15:36:03
581 文章
341921 浏览
24小时热文
更多
-
2025-12-07 22:52:28 -
2025-12-07 22:51:22 -
2025-12-07 21:52:07