
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
标题:13年后,AlexNet源代码终于公开:带注释的原版
想知道AlexNet 2012年的原始代码长什么样吗?现在,机会来了!谷歌首席科学家Jeff Dean宣布,他们与计算机历史博物馆(CHM)合作,共同发布了AlexNet的源代码,并将长期保存这些代码。开放后的代码库可以在GitHub上...
原文链接
北京交通大学研究团队发布了O1-CODER,一款专注于编码任务的开源模型。该模型结合了强化学习(RL)与蒙特卡洛树搜索(MCTS),旨在提升代码生成的质量。研究发现,基于伪代码的推理显著提高了代码生成质量,并且结合监督微调(SFT)与直接偏好优化(DPO)提升了测试用例生成效果。此外,自我对弈强化学习机制通过生成标准化的测试用例和过程奖励数据,实现了策略模型的持续优化。实验结果显示,经过优化后的模型在MBPP数据集上的平均采样通过率显著提升。
原文链接
加载更多

暂无内容