2024年图灵奖授予了安德鲁·巴托和理查德·萨顿,他们因在强化学习领域的开创性工作而获奖。巴托和萨顿的研究使机器能通过试错和奖惩机制自主学习,这一技术在AlphaGo和ChatGPT中得到应用。然而,在获奖后,他们批评当前AI公司过度商业化,忽视技术研究和安全性。这与2018年图灵奖得主本希奥、辛顿和杨立昆的观点一致,他们都对AI技术的滥用表示担忧。近期,埃里克·施密特等人警告称,AI领域的军备竞赛可能带来不可预测的风险,类似于核武器竞赛。科学家们呼吁加强对AI发展的监管,确保其安全可控。
原文链接
本文链接:https://kx.umi6.com/article/15147.html
转载请注明文章出处
相关推荐
.png)
换一换
OpenAI新模型被曝秘密训练中,o4会是什么样?
2025-06-10 18:54:49
稚晖君机器人“葡萄缝针”神技再现江湖 这次是人形的
2025-03-11 23:55:21
月之暗面因 DeepSeek 调整工作重心?内部人士:强化学习或许会是个方向
2025-02-15 18:07:16
o3拿下IOI 2024金牌!新论文公布RL秘诀:AI自己设计测试时推理策略,无需人类干预
2025-02-12 15:29:54
万字梳理:揭秘 DeepSeek 中的 RL 与 AGI 下一步丨AIR 2025
2025-03-08 11:48:22
RL 是推理神器?清华上交大最新研究指出:RL 让大模型更会“套公式”、却不会真推理
2025-04-23 11:57:26
我们让GPT玩狼人杀,它特别喜欢杀0号和1号,为什么?
2025-05-23 13:51:09
DeepSeek新模型大揭秘,为何它能震动全球AI圈
2025-01-23 15:26:36
超低成本复现QwQ!数学推理模型训练迎来RL暴击,数据代码全开源 | 蚂蚁&清华出品
2025-04-01 11:18:45
强化学习之于 AI Agent,是灵魂、还是包袱?
2025-04-23 11:56:20
多模态模型学会“按需搜索”,少搜30%还更准!字节&NTU新研究优化多模态模型搜索策略
2025-07-09 14:06:26
图灵奖的获奖者们,担心成为AI界的“奥本海默”
2025-03-10 15:42:20
突破多模态奖励瓶颈!中科院清华快手联合提出R1-Reward,用强化学习赋予模型长期推理能力
2025-05-08 18:33:15
520 文章
215261 浏览
24小时热文
更多

-
2025-09-09 14:14:29
-
2025-09-09 13:18:11
-
2025-09-09 13:17:04