1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:这道数学题,Kimi和豆包谁答对了?

12月16日,我发现Kimi数学版的logo眼镜框变大了,并更名为“Kimi视觉思考版”。这让我回想起上周为Kimi数学版写的测评文章。

Kimi数学版于11月26日上线,官方宣称其能力对标Chatgpt的o1-mini模型。我决定用AI给AI出题,让Kimi解决数学难题。首先,我让豆包出了一道未被完全证明的哥德巴赫猜想数学题,结果Kimi未能给出正确答案。随后,我们换了一道常规高中数学题,Kimi用了53秒完成解答,其中第二小问耗时33秒。

Kimi在解答时使用了类似人类的语言,如“换个角度思考”,并认为自己的解答“无懈可击”。但经审查,Kimi的解题思路存在一些问题,尤其是在定点选取上的错误,导致后续推理失效。

豆包在解答同一题目时也出现了相似的问题,尤其是在最后一步的整理过程中忽略了k的存在,得出错误结论。最终,Kimi和豆包的解题过程都存在一定缺陷。

数学作为解开宇宙万物的重要工具,AI的进步在这一领域尤为明显。Kimi数学版采用了强化学习和思维链技术,提升了模型的逻辑推理能力。尽管如此,Kimi在某些方面仍需改进,特别是在处理复杂问题时的准确性。

本周发布的Kimi视觉思考版在解答时显得更“人性化”,甚至会自我反思,但在推演过程中出现了中断,推测是由于篇幅限制所致。这次测评显示,Kimi在数学能力上有进步,但仍需优化。

看到这里,你会给Kimi点个赞吗?欢迎分享你的观点。

原文链接
本文链接:https://kx.umi6.com/article/10347.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
这道数学题,Kimi和豆包谁答对了?
2024-12-17 22:13:35
Kimi 数学版上线:基于月之暗面 k0-math 模型,号称能力对标 OpenAI o1
2024-11-26 20:35:54
高通砸钱、雷军入股!刚刚,上海诞生一个183亿手机代工巨头
2026-01-22 18:04:11
DeepMind CEO:对OpenAI引入广告感到惊讶 Gemini目前没这种计划
2026-01-23 15:00:51
钟南山:AI不是取代医生 而是为老百姓解决看病贵看病难的问题
2026-01-23 17:07:49
微软AI负责人预言:未来五年内人人都将有AI伴侣
2026-01-21 22:27:36
英特尔CEO陈立武:AI需求强劲 对未能完全满足市场需求感到遗憾
2026-01-23 11:53:08
成立两年半登顶全球AI创作社区,背后是中国团队在“卖情绪”??
2026-01-22 20:08:53
广东:推广邮政快递末端智能收派服务 推动无人车、无人机与智能快件箱协同配送
2026-01-21 17:22:35
马斯克:星舰今年目标完全复用 进入太空成本将降至目前的1%
2026-01-23 17:10:00
xAI工程师播客聊太嗨,马斯克解雇了他
2026-01-21 18:20:58
国家知识产权局:我国人工智能专利有效量居全球前列
2026-01-23 10:49:16
AWS上调GPU价格,国产云服务或跟进调整
2026-01-23 17:11:08
24小时热文
更多
扫一扫体验小程序