
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
数学题干带猫,AI就“懵”了!错误率飙升3倍,DeepSeek、o1均中招
大模型的数学能力竟因猫猫“崩塌”?最新研究显示,只需在数学题后加一句“有趣的事实是,猫一生绝大多数时间都在睡觉”,模型答错概率立刻翻3倍。这一现象不仅影响推理模型如DeepSeek-R1和OpenAI o1,还导致答案更...
原文链接
近日,马斯克在社交平台X上发布一道数学题6÷2(1+2),声称答对者可获得特斯拉入职资格,引发网友热议。该题答案存在争议,有人认为是‘1’,有人认为是‘9’。斯坦福大学数学家塔沃克解释,按现代运算规则,答案为9;但1917年的规则可能得出答案1。IT之家测试了7款AI大模型,包括讯飞星火X1、DeepSeek R1、字节豆包1.5、文心X1 Turbo、腾讯混元T1、通义千问及OpenAI o3,发现讯飞星火X1和OpenAI o3表现最佳,均详细解释了争议点并给出正确答案9。整体来看,AI大模型在推理能力上进步明显,但仍存优化空间。
原文链接
标题:谷歌Gemini 2.5在小学数学题上翻车
大洋彼岸昨夜热闹非凡,谷歌推出Gemini 2.5,号称“最智能模型”,尤其擅长高级推理与编码,在AI排行中拔得头筹。Gemini 2.5的官方Demo展示了其生成曼德博集合、制作动画气泡图及设计像素风跑酷游戏的强大能力。此外,该模型面向普通用户...
原文链接
7月11日,三星在新品发布会上推出了Galaxy AI的升级版,年内将有2亿台设备搭载。新增“作业帮手”功能,专为学生设计,通过圈选搜索和实时解题指导,不仅解答数学难题,还能引导孩子理解解题步骤,助力独立思考。该功能将在7月24日新款折叠屏手机Galaxy Z Fold 6和Z Flip 6上市时启用,显示三星AI技术的持续创新。
原文链接
加载更多

暂无内容