标题:大模型首次打破围棋思维「黑盒」,打通科学发现新路径!上海AI Lab发布新一代InternThinker
围棋因其复杂性被视为衡量AI能力的重要任务。然而,当前AI虽在棋力、效率、通用性上有显著进步,但其推理过程仍属“黑盒”。上海AI Lab发布的InternThinker解决了这一问题,它是首个既能展现高水平围棋推理又具备透明思维链的大模型。
InternThinker通过“加速训练营”(InternBootcamp)实现推理能力提升。该平台能生成标准化、可扩展的推理任务,涵盖数学、科学、编程及棋类等,使大模型跳出传统数据标注模式,避免奖励欺骗,实现能力提升新范式。
在围棋任务中,InternThinker不仅能应对复杂局面,还能清晰解释每一步棋的决策过程。面对李世石的“神之一手”,它不仅给出正确应对,还用自然语言详细解析。此外,它还能根据玩家棋步给予幽默或犀利的评价,极具“活人感”。
棋力方面,InternThinker未来仍有提升空间,新生代围棋冠军王星昊评价其棋力约为职业3-5段。目前,InternThinker已开放公测,用户可通过链接体验。
此外,InternThinker在多任务混合强化学习中展现出“涌现效应”,单一任务无法完成的任务,通过混合训练后可成功完成。这一成果为解决更多复杂推理任务提供了可能。
上海AI Lab提出的通专融合技术路线,通过三层架构(基础模型层、融合协同层、探索进化层),使模型兼具通用泛化与专业能力。这一路径有望推动科学发现与产业创新。
公测链接:https://internlm-chat.intern-ai.org.cn/
开源地址:https://github.com/InternLM/InternBootcamp
— 完 —
.png)

-
2025-07-20 17:06:49
-
2025-07-20 16:05:44
-
2025-07-20 16:05:36