
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2025年8月,OpenAI宣布重大权力结构调整,CEO Sam Altman将日常运营交由5月任命的应用业务CEO Fidji Simo负责。Altman表示难以同时管理消费科技、超级基建、前沿研究等多领域,未来将聚焦万亿美元级融资、超级计算项目及脑机接口创业公司等前瞻性布局。Simo曾任职Facebook和Instacart,拥有丰富商业化经验,目标是将OpenAI从初创公司转型为上市科技巨头。她将领导ChatGPT等消费应用的商业化,并探索新产品如浏览器及购物搜索结果中的联盟链接变现模式。此次调整标志OpenAI从非营利研究机构向硅谷典型科技企业转型。
原文链接
2025年8月,字节发布全新数学模型Seed-Prover,在复杂数学问题解决领域取得突破性进展。该模型基于Lean 4形式化推理框架,并创新采用引理式证明范式,模块化处理数学推理过程。其在MiniF2F数据集上实现100%正确率,解决了78.1%的历年IMO难题,并在普特南数学竞赛中表现优异。此外,Seed-Prover集成专用几何推理引擎Seed-Geometry,在IMO 2025比赛中达到银牌水准,完整解决6道题中的4道及部分证明。Seed-Geometry还在2秒内解出IMO 2025第2题,展现了卓越效率和泛化能力。前谷歌成员Deedy Das评价称,字节是唯一一家为IMO发表完整论文的AI实验室。
原文链接
2025年,OpenAI的IMO金牌团队揭示其背后仅由三名核心开发者组成:Alexander Wei、Sheryl Hsu和Noam Brown,项目在竞赛前两三个月突击完成。模型成功攻克IMO难题被视为AI数学能力的重要里程碑,但在第六题上选择‘不作答’,显示出对自身能力边界的清晰认知。团队表示,这种行为避免了‘一本正经地胡说八道’,是AI的一大进步。此外,他们认为解决千禧年大奖难题仍遥不可及,因从1.5小时到数万小时思考时间的跨越难度极高。未来,团队计划将相关技术应用于更广泛的推理领域,并探索让AI学会‘提出问题’的能力。模型或开放供数学家使用,但具体细节仍在研究中。
原文链接
2025年7月,IMO赛场上演AI巅峰对决。7月19日,顶尖大模型几乎全军覆没;两天后,OpenAI和DeepMind等实验室斩获5/6题。7月23日,哈佛与UCLA学生用Gemini 2.5 Pro+多轮验证框架发布论文并开源代码。次日,蚂蚁AWorld团队仅用6小时复现DeepMind成果,开源一键运行的多智能体IMO系统。实验表明,多智能体协同能超越单模能力,解决复杂IMO问题,并提出构建最优输入、实现元认知等理论支持。AWorld采用事件驱动架构,具备模型即插即用、全链路可观测性等优势。团队透露,未来将测试“多智能体+形式化验证”组合,目标直指Lean4形式化证明。IMO或成人类最后一次战胜AI的机会。
原文链接
2025年8月,两位清华校友杨林和黄溢辰通过提示词工程和自我迭代验证流程,让基础模型Gemini 2.5 Pro成功解决了IMO 2025的5道题目,达到金牌水平。研究团队设计了一套六步验证流程,利用通用提示词显著提升模型推理能力,无需依赖高昂计算资源。实验结果表明,结构化迭代能突破单次生成的局限性,而详细的提示词可提高效率但不增加新能力。尽管第六题未能解决,研究人员认为验证器改进是关键。此研究展示了学术界在有限资源下也能媲美大厂的潜力,并期待AI未来在数学领域的更大贡献。论文链接及代码已公开。
原文链接
2025年8月2日,OpenAI的IMO金牌模型因在国际数学奥林匹克(IMO)第6题上坦承“不会”而引发关注。尽管未解出这道复杂网格覆盖问题,但模型展现了“高智商的诚实”,避免了生成错误答案。研究员Noam Brown指出,这种能力显著减少隐藏错误,标志着AI从幻觉式回答转向更具自我意识的阶段。团队成员Alex Wei、Sheryl Hsu和Noam Brown还分享了开发细节,他们仅用两月便达成了IMO金牌目标。核心团队由三位顶尖科学家组成,包括前谷歌与Meta研究员Alex Wei、斯坦福大学研究员Sheryl Hsu,以及卡内基·梅隆博士Noam Brown。OpenAI强调其研究自主性与通用技术优先策略。
原文链接
谷歌DeepMind推出的Gemini 2.5 Deep Think模型现已在Gemini App上线,该模型曾获IMO金牌。新版速度更快,但实力略逊于原版,可达到IMO铜牌水平。模型仅对Ultra订阅用户开放,月费约1803元人民币。DeepMind称其推理性能超越OpenAI的o3和马斯克的Grok 4,在代码性能和科学知识测试中表现最佳。优势包括迭代开发、科学数学发现、算法编写等。通过扩展并行“思考时间”,模型能生成多种想法并优化解决方案。团队还开发了强化学习技术提升性能,模型还可融合多篇论文观点,助力研究。参考链接已附上。
原文链接
2025年国际数学奥林匹克(IMO)在澳大利亚落幕,AI领域迎来重要突破。OpenAI和DeepMind先后宣布其模型达到IMO金牌标准,分别获得35分,这是AI首次比肩顶尖高中生选手。OpenAI提前公布成绩引发争议,DeepMind则获IMO官方认证,但其金牌团队三名核心研究员已被Meta挖角。尽管AI取得显著进步,但专家认为这并非数学界的AlphaGo时刻,因72名人类选手同样达金牌标准,且AI仅解出5道题。此次突破证明语言模型可直接完成高难度数学推理,但仍存局限性。学术界对AI辅助数学研究褒贬不一,有人看好其潜力,也有人担忧数学自由探索精神被技术资本侵蚀。
原文链接
2025年7月,谷歌DeepMind团队在IMO(国际数学奥林匹克竞赛)中斩获金牌后,公开晒出团队大合照,并圈出每位成员的联系方式,引发广泛关注。这一举动被外界解读为对Meta(小扎)此前挖角行为的回应与‘挑衅’。此前,Meta迅速挖走了谷歌IMO团队中的三名核心华人成员,但这三人并未出现在合照中。团队负责人Thang Luong透露,来自山景城、纽约、新加坡等地的核心成员在伦敦总部集结,进行了一周的冲刺训练,最终完成对模型Gemini Deep Think的巅峰优化。团队成员包括多位顶尖科学家,如Yi Tay、Quoc Le等,他们在数学推理与代码生成等领域取得突破性进展。此次公开合照和名单不仅展示了谷歌的信心,也引发了行业对人才争夺战的新一轮关注。
原文链接
2025年7月,OpenAI宣布其未公开实验性大语言模型在国际数学奥林匹克竞赛(IMO)中获得金牌,得分35/42,引发争议。IMO组委会曾要求参赛AI公司闭幕式后一周再公布结果,以尊重人类选手并验证答案,但OpenAI在闭幕式当天(7月19日)即抢先发布。谷歌DeepMind同样获得金牌,但选择低调遵守规则。IMO评审团批评OpenAI的做法不尊重赛事规范。此外,OpenAI未参与官方评分流程,且拒绝了IMO提供的Lean格式题目支持。专家指出,若依据官方评分标准,OpenAI可能仅获银牌。OpenAI回应称未被告知‘一周后发布’的要求,且强调其发布时间符合闭幕式后建议。此事件引发广泛讨论。
原文链接
加载更多

暂无内容