1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
数学题干带猫AI就不会了!错误率翻300%,DeepSeek、o1都不能幸免
数学题干带猫,AI就“懵”了!错误率飙升3倍,DeepSeek、o1均中招 大模型的数学能力竟因猫猫“崩塌”?最新研究显示,只需在数学题后加一句“有趣的事实是,猫一生绝大多数时间都在睡觉”,模型答错概率立刻翻3倍。这一现象不仅影响推理模型如DeepSeek-R1和OpenAI o1,还导致答案更...
梦境编程师
07-05 20:03:35
大模型错误率
数学题
猫猫攻击
分享至
打开微信扫一扫
内容投诉
生成图片
答对有资格入职特斯拉?马斯克这道数学题,我们用七大 AI 模型测了一遍
近日,马斯克在社交平台X上发布一道数学题6÷2(1+2),声称答对者可获得特斯拉入职资格,引发网友热议。该题答案存在争议,有人认为是‘1’,有人认为是‘9’。斯坦福大学数学家塔沃克解释,按现代运算规则,答案为9;但1917年的规则可能得出答案1。IT之家测试了7款AI大模型,包括讯飞星火X1、DeepSeek R1、字节豆包1.5、文心X1 Turbo、腾讯混元T1、通义千问及OpenAI o3,发现讯飞星火X1和OpenAI o3表现最佳,均详细解释了争议点并给出正确答案9。整体来看,AI大模型在推理能力上进步明显,但仍存优化空间。
数码游侠
04-27 16:20:17
AI模型
争议
数学题
分享至
打开微信扫一扫
内容投诉
生成图片
以一敌五、屠榜登顶的谷歌Gemini 2.5,居然栽在小学数学题上
标题:谷歌Gemini 2.5在小学数学题上翻车 大洋彼岸昨夜热闹非凡,谷歌推出Gemini 2.5,号称“最智能模型”,尤其擅长高级推理与编码,在AI排行中拔得头筹。Gemini 2.5的官方Demo展示了其生成曼德博集合、制作动画气泡图及设计像素风跑酷游戏的强大能力。此外,该模型面向普通用户...
元界筑梦师
03-26 21:12:35
Gemini 2.5
大模型
数学题
分享至
打开微信扫一扫
内容投诉
生成图片
三星 Galaxy AI 新增“作业帮手”功能,可教学生解数学题
7月11日,三星在新品发布会上推出了Galaxy AI的升级版,年内将有2亿台设备搭载。新增“作业帮手”功能,专为学生设计,通过圈选搜索和实时解题指导,不仅解答数学难题,还能引导孩子理解解题步骤,助力独立思考。该功能将在7月24日新款折叠屏手机Galaxy Z Fold 6和Z Flip 6上市时启用,显示三星AI技术的持续创新。
AI思维矩阵
07-11 22:30:22
三星 Galaxy AI
作业帮手
数学题解答
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序