
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
清华AI数学家:独立完成理论难题,自动调用基本定理构建证明思路
近日,清华大学团队推出了一款名为AIM(AI Mathematician)的数学推理框架,旨在解决前沿数学理论问题。这项技术通过自动化推理,能够独立完成复杂理论的证明工作,并展现出较高的完成度。
例如,在解决吸收边界条件问题时,AI...
原文链接
标题:陶哲轩转发!DeepMind开源「AI数学证明标准习题集」
DeepMind最新开源了形式化数学猜想库,这一资源集合了经典数学猜想的形式化表述,如解析数论中的朗道问题。此外,库中提供代码函数,便于将自然语言的数学猜想转化为形式化表述。
陶哲轩曾利用Lean工具形式化证明PFR猜想,其第一步正是...
原文链接
形式化证明与大模型:共创可验证的AI数学未来|量子位直播
5月,多个重要进展引发关注:DeepSeek Prover V2发布、陶哲轩的AI数学直播以及谷歌推出的AlphaEvolve。大模型在解数学题方面的表现已成为衡量AI“智能天花板”的关键指标,吸引了众多团队投入研究。
为更好评估AI的数...
原文链接
陶哲轩“喂饭级”AI教程来了!只用GitHub Copilot证明函数极限问题
视频新人博主陶哲轩更新了!这次带来“喂饭级”AI教程,手把手演示如何仅靠GitHub Copilot证明函数极限问题。
此前,陶哲轩主要用GitHub Copilot辅助代码补全,但若想用它证明数学定理,通常需要人类...
原文链接
4月30日,DeepSeek推出数学定理证明专用模型DeepSeek-Prover-V2,参数规模达671B,miniF2F测试通过率达88.9%,显著优于前代V1.5及月之暗面的Kimina-Prover(通过率80.7%)。DeepSeek-Prover-V2基于强化学习和子目标分解技术,延续其模型矩阵同步进化策略。此前,梁文锋与杨植麟曾在2月论文中“撞车”,双方均聚焦Transformer架构的注意力机制。当前,DeepSeek面临阿里巴巴通义千问Qwen3(参数量1/3,性能超越R1)和百度文心4.5 Turbo的竞争压力;而月之暗面的Kimi则需应对腾讯元宝的用户增长冲击,后者一季度投流费用达14亿元。DeepSeek正加速研发R2和V4版本,但市场对其依赖华为昇腾芯片存疑。业内呼吁中国大模型产业需多元竞争,而非一家独大。
原文链接
陶哲轩油管首秀:AI助力量化证明效率
快来围观,陶哲轩当起了视频博主。首个视频就炸裂全场:人类需写满一页纸的证明,AI仅用33分钟搞定?
整个过程流畅高效,全程“盲证”,无需过多思考。网友们惊叹:“这具有历史意义。”短短一天,订阅数已达900+,观看数超两千,还在持续增长中。
具体来看,陶哲...
原文链接
DeepSeek放大招!新模型DeepSeek-Prover-V2专注于数学定理证明,刷新多项高难度基准测试记录。在普特南测试中,该模型成功解答49道题,远超目前排名第一的Kimina-Prover(仅解出10题)。而未优化的DeepSeek-R1仅解出1题,令人期待R2的表现。
论文中特别提到“通...
原文链接
4月30日,深度求索(DeepSeek)在Hugging Face上发布DeepSeek-Prover-V2-671B新模型。该模型专注于形式化数学推理,基于DeepSeek-V3-0324,采用递归定理证明管道生成初始数据。DeepSeek推出671B参数的DeepSeek-Prover-V2-671B和7B参数的DeepSeek-Prover-V2-7B两款模型,以及ProverBench数据集。团队通过分解复杂定理为子目标,并利用7B模型处理子目标证明,结合DeepSeek-V3的思维链生成强化学习数据。最终,671B版本在MiniF2F-test数据集上达到88.9%通过率,在PutnamBench数据集中解决问题49个。ProverBench数据集包含325个数学问题,覆盖高中竞赛及本科数学领域,推动AI数学推理能力的评估与应用。
原文链接
正文:第二届人工智能生成内容国际会议暨大模型应用创新大会(AIGC 2024)将于近期举行。此次大会汇聚了众多行业专家和学者,参会者将有机会与他们面对面交流,获取专属参会证明和精美礼品,并享有优先座位和免费自助午餐。目前,参会名额正在火热预定中,报名通道即将关闭,先到先得。会议详情及报名方式可通过扫描小程序二维码获取。有任何疑问可联系会议秘书,邮箱 contact@icaigc.org,手机/微信 15618780723。期待您的参与!
原文链接
近日,关于AI模型Grok 3“证明”黎曼猜想的消息引发热议。xAI暂停了Grok 3的训练以验证其证明,若结果正确将终止训练。黎曼猜想是千禧年七大数学难题之一。然而,xAI工程师Hieu Pham随后澄清这只是他的调侃。此前有传言称Grok 3在训练中遭遇了灾难性事件,引发了广泛讨论。尽管如此,AI在数学领域的潜力仍受到关注。例如,AlphaProof在IMO竞赛中表现出色,证明了部分数学题。AI在数学上的进展有望在未来几年加速,但仍需克服计算资源和问题复杂性的挑战。马斯克承诺的Grok 3预计年底发布,可能会带来更多惊喜。
原文链接
加载更多

暂无内容