智谱官方于12月31日发布了GLM-Zero预览版,这是首个基于扩展强化学习技术训练的推理模型。该模型专长于数理逻辑、代码及复杂问题的深度推理。在AIME 2024、MATH500和LiveCodeBench评测中,GLM-Zero-Preview的表现与OpenAI o1-preview相当。以2025年考研数学一为例,GLM-Zero-Preview获得了126分。尽管目前与OpenAI的o3模型仍有差距,但官方表示将持续优化。GLM-Zero-Preview已上线,体验地址包括智谱清言和智谱开放平台。
原文链接
本文链接:https://kx.umi6.com/article/11050.html
转载请注明文章出处
相关推荐
换一换
推理模型 DeepSeek-R1-Lite 预览版上线,号称媲美 OpenAI o1-preview
2024-11-20 23:21:18
解构Manus AI:这是通用Agent革命,还是精巧缝合怪?
2025-03-08 16:59:56
武汉人工智能研究院院长王金桥:未来大模型战场将转向推理模型| AI领先者心声・2025
2025-01-06 16:36:35
阿里Qwen团队发布新推模型QwQ 会展示完整的思维链
2025-02-25 12:56:25
揭秘:OpenAI是如何发展出推理模型的?
2025-08-04 18:05:57
o3-pro答高难题文字游戏引围观,OpenAI前员工讽刺苹果:这都不叫推理那什么叫推理
2025-06-13 12:06:17
直逼 DeepSeek-R1-32B,UC 伯克利等开源全新 SOTA 推理模型 OpenThinker-32B
2025-02-13 17:19:50
2025 年考研数学一得 126 分,智谱深度推理模型 GLM-Zero 预览版上线
2024-12-31 18:45:44
OpenAI两大推理模型,要把Agent吞进模型里了
2025-04-17 12:36:09
成本不到150元!李飞飞等26分钟训出个推理模型,媲美o1和R1,秘诀:用蒸馏
2025-02-07 08:47:13
OpenAI的推理模型有时会用中文“思考” 背后原因众说纷纭
2025-01-15 04:22:06
免费o1替代品来了!谷歌新发“王炸”推理大模型:思考速度碾压其他大模型,水平堪比理科博士
2024-12-23 10:51:33
苹果炮轰推理模型全是假思考!4个游戏戳破神话,o3/DeepSeek高难度全崩溃
2025-06-08 12:05:30
541 文章
281992 浏览
24小时热文
更多
-
2025-10-25 10:17:38 -
2025-10-25 08:14:19 -
2025-10-24 22:57:14