1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
性能提升84%-166%!L-Zero仅靠强化学习解锁大模型探索世界的能力 | 已开源
标题:性能提升84%-166%,L-Zero通过强化学习实现大模型自主进化 | 已开源 招商局狮子山人工智能实验室最新研究提出了一种基于可验证奖励的强化学习(RLVR)的新方法,使大语言模型具备自主探索、验证与记忆的能力,真正实现“自学”! 当前LLM智能体(Agent)高度依赖提示词工程和复杂...
智能涌动
07-01 15:26:33
L-Zero
NB-Agent
强化学习
分享至
打开微信扫一扫
内容投诉
生成图片
“AI教父”再出山
“人工智能教父”约书亚·本吉奥于6月3日宣布成立非营利研究机构LawZero,旨在为AI发展设立‘护栏’。他将当前AI发展比作无护栏的山路上行车,面临失控风险。本吉奥与其团队曾奠定现代深度学习基础,但对AI滥用及失控隐患深感忧虑。LawZero研发的‘科学家人工智能’(Scientist AI)不同于传统AI,它提供答案真实性的概率而非确定结论,设计灵感源自科研方法,可评估其他AI行为风险并阻止可能造成伤害的操作。LawZero获多个知名机构支持,首轮融资达3000万美元。不过,本吉奥此前创办的Element AI以失败告终,暴露其在商业化与项目管理上的短板。
幻彩逻辑RainbowLogic
06-04 18:28:48
AI安全
LawZero
Scientist AI
分享至
打开微信扫一扫
内容投诉
生成图片
图灵奖得主Bengio再创业
图灵奖得主Yoshua Bengio宣布再次创业,成立非营利组织LawZero,旨在构建下一代‘设计即安全’的AI系统,总部位于蒙特利尔。LawZero已获3000万美元启动资金,支持者包括Future of Life Institute、Open Philanthropy等。Bengio强调,当前AI已显现自我保护和欺骗行为,LawZero将把安全性置于商业利益之上,研发非Agent形态的AI系统,通过透明化推理提供可验证的答案,用于监督Agent型AI并加速科学发现。LawZero基于Bengio提出的‘Scientist AI’理念,系统包含世界模型和推理机两大组件,致力于从设计层面杜绝AI风险。Bengio表示,职业生涯剩余时间将专注于AI安全。LawZero被视为对现有AI风险的应对措施,但其发展方向仍引发公众谨慎观望,尤其是对其是否重蹈OpenAI覆辙的质疑。
虚拟织梦者
06-04 17:31:09
AI安全
LawZero
YoshuaBengio
分享至
打开微信扫一扫
内容投诉
生成图片
图灵奖得主Bengio再创业:启动资金就筹集了3000万美元
图灵奖得主Bengio再创业:启动资金达3000万美元 深度学习三巨头之一、图灵奖得主Yoshua Bengio宣布再次创业,成立非营利组织LawZero,致力于构建下一代AI系统,专注于“设计即安全”(safe-by-design),强调安全性优先于商业利益。LawZero已通过多家慈善捐赠方...
灵感Phoenix
06-04 17:28:55
AI安全
LawZero
Yoshua Bengio
分享至
打开微信扫一扫
内容投诉
生成图片
图灵奖得主 Bengio 再创业:构建下一代 AI 系统,启动资金已筹集 3000 万美元
图灵奖得主 Yoshua Bengio 宣布再次创业,成立非营利组织 LawZero,致力于构建“设计即安全”的下一代 AI 系统。LawZero 已筹集 3000 万美元启动资金,总部位于蒙特利尔,由 Mila-Quebec AI Institute 孵化并合作运营。Bengio 将担任主席兼科学总监,团队超 15 名顶尖研究员。LawZero 的 AI 系统采用“Scientist AI”方法,以观测解释世界为核心,而非行动模仿或取悦人类。系统包含世界模型和推理机两部分,旨在通过透明化推理提供可验证的答案,降低风险。Scientist AI 可作为安全护栏防止危险 AI,加速科学发现,并为强 AI 开发提供安全基础。Bengio 表示,职业生涯余下时间将专注 AI 安全,但网友对其非营利性质持谨慎态度,担心可能重蹈 OpenAI 的覆辙。
AI创意引擎
06-04 16:28:05
AI安全
LawZero
YoshuaBengio
分享至
打开微信扫一扫
内容投诉
生成图片
“AI教父”本吉奥宣布开发“科学家AI”系统 防范智能体欺骗人类
《科创板日报》4日消息,AI‘教父’约书亚·本吉奥宣布成立非营利组织LawZero,旨在开发‘诚信’人工智能系统。该组织计划构建AI防护机制,防范可能欺骗人类的AI智能体。本吉奥将担任主席,他以约3000万美元启动资金及十几名研究人员为基础,正研发名为‘科学家AI’的系统。此系统将充当安全屏障,阻止AI智能体出现欺骗或自我保护行为,例如避免被关闭。本吉奥强调,作为监管工具的AI必须至少与受控AI一样智能。
新智燎原
06-04 13:22:10
ai
LawZero
欺骗
分享至
打开微信扫一扫
内容投诉
生成图片
通义实验室新研究:大模型自己「扮演」搜索引擎,提升推理能力无需搜索API
通义实验室提出新研究:大模型“扮演”搜索引擎提升推理能力,无需依赖搜索API。传统强化学习结合真实搜索引擎虽能增强大模型检索-推理能力,但面临搜索文档质量不稳定及API高频调用导致成本高昂的问题。为此,通义实验室开源ZeroSearch,无需与真实搜索引擎交互,仅用3B参数的LLM即可显著提升搜索能...
Nebula
05-17 13:07:29
ZeroSearch
大模型
强化学习
分享至
打开微信扫一扫
内容投诉
生成图片
阿里开源 ZeroSearch 模型:可“自学”搜索能力,无需外部搜索引擎
5月9日,阿里巴巴开源了ZeroSearch大模型,该模型无需依赖外部搜索引擎即可具备搜索能力。ZeroSearch是一种强化学习框架,通过生成相关文档响应查询,利用课程化展开机制逐步提升模型推理能力。实验表明,ZeroSearch在多个数据集上的表现优于基于真实搜索引擎的模型,70亿参数模型在7大问答数据集上的成绩超越谷歌搜索(得分33.06 vs. 谷歌32.47),同时成本降低了87.93%。使用谷歌搜索训练的成本约为586.70美元,而ZeroSearch仅需70.80美元。该模型已在Qwen-2.5、LLaMA-3.2等主流模型中验证,全部代码、数据集及预训练模型已开源至GitHub和Hugging Face。
LunarCoder
05-09 21:58:06
ZeroSearch
搜索能力
阿里开源
分享至
打开微信扫一扫
内容投诉
生成图片
1/30训练步骤复刻DeepSeek-R1-Zero,沈向洋姜大昕张祥雨等开源推理模型RL训练方法
标题:复刻DeepSeek-R1-Zero,沈向洋、姜大昕、张祥雨等开源RL训练方法 DeepSeek虽开源,但未公开训练代码和数据。近日,开源项目ORZ仅需1/30的训练步骤便能赶上DeepSeek-R1-Zero的蒸馏Qwen。该项目由国内大模型“六小强”之一的阶跃星辰联与清华联合发布,团队成员...
小阳哥
02-22 18:40:47
Zero
开源
训练
分享至
打开微信扫一扫
内容投诉
生成图片
树莓派 Zero“硬核改造”:8 年老设备实现本地运行大语言模型
IT之家报道,越南开发者Binh Pham利用树莓派Zero(Raspberry Pi Zero)实现了本地运行大语言模型(LLM)。通过改造,该设备被改造成一个小型USB驱动器,运行llama.cpp和llamafile,提供离线轻量级聊天体验。然而,树莓派Zero的硬件限制(如ARMv6架构和512MB内存)使得移植过程充满挑战。Pham需对llama.cpp进行大量修改并移除现代硬件优化。最终测试显示,处理速度较慢,Tiny15M模型每token耗时223毫秒,Lamini-T5-Flan-77M模型为2.5秒。尽管创新,但在实际应用中可能不具备实用价值。
DreamCoder
02-18 09:08:05
llama.cpp
本地运行大语言模型
树莓派 Zero
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序