1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:大模型首次打破围棋思维「黑盒」,打通科学发现新路径!上海AI Lab发布新一代InternThinker

围棋因其复杂性被视为衡量AI能力的重要任务。然而,当前AI虽在棋力、效率、通用性上有显著进步,但其推理过程仍属“黑盒”。上海AI Lab发布的InternThinker解决了这一问题,它是首个既能展现高水平围棋推理又具备透明思维链的大模型。

InternThinker通过“加速训练营”(InternBootcamp)实现推理能力提升。该平台能生成标准化、可扩展的推理任务,涵盖数学、科学、编程及棋类等,使大模型跳出传统数据标注模式,避免奖励欺骗,实现能力提升新范式。

在围棋任务中,InternThinker不仅能应对复杂局面,还能清晰解释每一步棋的决策过程。面对李世石的“神之一手”,它不仅给出正确应对,还用自然语言详细解析。此外,它还能根据玩家棋步给予幽默或犀利的评价,极具“活人感”。

棋力方面,InternThinker未来仍有提升空间,新生代围棋冠军王星昊评价其棋力约为职业3-5段。目前,InternThinker已开放公测,用户可通过链接体验。

此外,InternThinker在多任务混合强化学习中展现出“涌现效应”,单一任务无法完成的任务,通过混合训练后可成功完成。这一成果为解决更多复杂推理任务提供了可能。

上海AI Lab提出的通专融合技术路线,通过三层架构(基础模型层、融合协同层、探索进化层),使模型兼具通用泛化与专业能力。这一路径有望推动科学发现与产业创新。

公测链接:https://internlm-chat.intern-ai.org.cn/
开源地址:https://github.com/InternLM/InternBootcamp

— 完 —

原文链接
本文链接:https://kx.umi6.com/article/19170.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
大模型隐私安全和公平性有“跷跷板”效应,最佳平衡法则刚刚找到 | 人大&上海AI Lab
2025-07-28 09:07:15
大模型产生幻觉 全怪人类PUA吗
2025-09-12 01:04:40
大模型低调出展,机器人各出奇招
2025-07-26 22:49:04
GPT-5 没有惊喜,但信号拉满
2025-08-11 13:00:45
把枯燥的工作先扔给大模型?
2025-08-15 12:12:45
李飞飞的答案:大模型之后,Agent向何处去?
2025-09-05 09:13:59
华人AI大神霸气离职,一篇博客挑明中美大模型暗战
2025-10-11 10:14:30
大模型“记性差一点”反而更聪明!金鱼损失随机剔除token,让AI不再死记硬背
2025-09-03 17:49:26
用DeepSeek改造ERP,到底难在哪?怎么破?
2025-10-11 09:33:30
关于 AI Infra 的一切
2025-08-11 19:08:22
1万tokens是检验长文本的新基准,超过后18款大模型集体失智
2025-07-17 15:23:24
几乎都在挂羊头卖狗肉!AI Agent泡沫实在太大了
2025-10-20 11:04:42
DeepSeek删豆包冲上热搜,大模型世子之争演都不演了
2025-08-21 13:31:42
24小时热文
更多
扫一扫体验小程序