形式化证明与大模型:共创可验证的AI数学未来|量子位直播
5月,多个重要进展引发关注:DeepSeek Prover V2发布、陶哲轩的AI数学直播以及谷歌推出的AlphaEvolve。大模型在解数学题方面的表现已成为衡量AI“智能天花板”的关键指标,吸引了众多团队投入研究。
为更好评估AI的数学推理能力,近期发布的FormalMATH基准测试受到广泛关注。那么,当前AI自动定理证明的表现如何?主要技术路径有哪些?其对大模型的应用又将产生什么影响?
5月29日晚20:00,量子位联合2077AI开源基金会举办直播活动,邀请DeepSeek Prover、FormalMath、Kinima等项目的多位专家探讨大语言模型在形式化证明领域的前沿探索。
直播嘉宾
- 辛华剑,爱丁堡大学博士生,DeepSeek Prover项目第一作者
- 刘威扬,香港中文大学博士生导师,资深学者
- 付杰,上海人工智能实验室研究员,人工智能领域专家
- 郁昼亮,香港中文大学博士生,FormalMath项目第一作者
- 王海明,月之暗面(Moonshot AI)技术负责人,Kinima项目技术领衔人
- 刘征瀛,月之暗面(Moonshot AI)技术负责人,资深技术专家
- 李祎哲,浙江大学博士生,数学领域青年研究者
- 刘明皓,资深算法工程师,2077AI核心发起人、贡献者
直播议程
详见附图
本周四晚20:00,让我们一起探讨AI数学的未来!
原文链接
本文链接:https://kx.umi6.com/article/19287.html
转载请注明文章出处
相关推荐
.png)
换一换
大模型开始打王者荣耀了
2025-09-02 12:31:33
大模型低调出展,机器人各出奇招
2025-07-26 22:49:04
大模型“拼好题”,45K数据撬动18%提升,数学问题拒绝死记硬背 | MathFusion
2025-06-17 17:24:53
中国信通院开展面向大模型的全栈国产软硬件系统适配测试工作
2025-07-23 16:55:22
字节对大模型方向加码期权激励 核心技术员工最高可获百万元
2025-09-03 15:50:37
一场「狼人杀」,考倒了一堆大模型
2025-08-28 14:28:50
蚂蚁密算开源高阶程序HOP框架
2025-07-27 16:06:47
上海累计82款大模型通过备案
2025-07-10 11:28:53
企业管理软件是不是和AI无关?
2025-06-23 13:23:28
王兴一鸣惊人!美团首个开源大模型追平DeepSeek-V3.1
2025-09-01 13:16:16
2025WAIC:大厂回归,医疗AI爆火出圈
2025-07-30 15:47:42
大模型隐私安全和公平性有“跷跷板”效应,最佳平衡法则刚刚找到
2025-07-27 21:02:57
从黑箱到显微镜:大模型可解释性的现状与未来
2025-06-17 18:41:56
528 文章
178532 浏览
24小时热文
更多

-
2025-09-08 23:04:48
-
2025-09-08 22:04:30
-
2025-09-08 21:06:20