1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

近日,马斯克在社交平台X上发布一道数学题6÷2(1+2),声称答对者可获得特斯拉入职资格,引发网友热议。该题答案存在争议,有人认为是‘1’,有人认为是‘9’。斯坦福大学数学家塔沃克解释,按现代运算规则,答案为9;但1917年的规则可能得出答案1。IT之家测试了7款AI大模型,包括讯飞星火X1、DeepSeek R1、字节豆包1.5、文心X1 Turbo、腾讯混元T1、通义千问及OpenAI o3,发现讯飞星火X1和OpenAI o3表现最佳,均详细解释了争议点并给出正确答案9。整体来看,AI大模型在推理能力上进步明显,但仍存优化空间。

原文链接
本文链接:https://kx.umi6.com/article/17867.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
从GPT-5到DeepSeek V3.1,顶尖AI大模型的新方向出现了!
2025-09-01 16:20:02
第一时间体验GPT-5,人人免费可用,马斯克表示不服
2025-08-08 06:03:18
DeepSeek-Prover-V2-671B 新模型开源发布
2025-04-30 19:50:58
只需一张照片,几行代码,o3就让你的生活暴露在大众眼中
2025-04-27 16:21:23
阿里达摩院联合发布全球首个胃癌影像筛查 AI 模型 DAMO GRAPE
2025-06-25 19:33:44
挑战AI数学推理极限!大规模形式化数学基准FormalMATH发布,最强模型成功率仅16%
2025-05-08 09:23:53
人类VS AI:波兰程序员10小时编程马拉松中击败OpenAI!
2025-07-20 19:08:20
快手发布可灵 2.0 视频生成模型及可图 2.0 图像生成模型
2025-04-15 15:33:39
不听指挥?OpenAI模型被曝拒绝执行人类指令
2025-05-27 11:26:48
数学题干带猫AI就不会了!错误率翻300%,DeepSeek、o1都不能幸免
2025-07-05 20:03:35
GPT-5发布了,到底有没有那么神?
2025-08-08 09:10:02
扎克伯格不挖人了?消息称 Meta 考虑采用 OpenAI 或谷歌的 AI 模型
2025-08-30 10:50:03
用AI把一段视频变成可视化网页,Google的新模型又卷飞了
2025-05-07 11:05:10
24小时热文
更多
扫一扫体验小程序