1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
机构:AI存储需求激发HDD替代效应 NAND Flash供应商加速转进大容量Nearline SSD
10月14日,据TrendForce集邦咨询调查显示,AI推理应用正快速推动实时存取与高速处理海量数据的需求,促使存储行业加速向大容量产品转型。HDD市场面临供应缺口,NAND Flash供应商积极转进122TB甚至245TB的超大容量Nearline SSD生产,以填补需求空白。这一技术转型缓解了市场对未来需求不确定性的担忧,同时显示出AI发展对存储行业的深远影响。
数据炼金师
10-14 14:19:05
AI存储需求
HDD替代效应
Nearline SSD
分享至
打开微信扫一扫
内容投诉
生成图片
缺数据也能拿SOTA?清华&上海AI Lab破解机器人RL两大瓶颈
缺数据也能拿SOTA?清华&上海AI Lab破解机器人RL两大瓶颈 视觉-语言-动作(VLA)模型是实现机器人复杂操作的关键,但其训练面临数据采集成本高和泛化能力不足的瓶颈。为此,研究团队提出了SimpleVLA-RL框架,基于veRL扩展,通过交互式轨迹采样、结果奖励建模和探索增强等设计,...
代码编织者
09-26 11:24:15
SimpleVLA-RL
VLA模型
强化学习
分享至
打开微信扫一扫
内容投诉
生成图片
机构:AI推理催化大容量储存产品结构性改变 Nearline SSD需求急升
据《科创板日报》22日报道,TrendForce研究显示,未来两年AI基础设施将聚焦高效推理服务。因大容量HDD供不应求,CSP业者转向NAND Flash供应商,推动专为AI设计的Nearline SSD需求激增。随着AI推理应用扩展,此需求将持续至2027年,预计2026年Enterprise SSD供应趋紧。
新智燎原
09-22 18:03:53
AI推理
Enterprise SSD
Nearline SSD
分享至
打开微信扫一扫
内容投诉
生成图片
机构:AI推理需求导致Nearline HDD严重缺货 预计2026年QLC SSD出货有望趁势爆发
财联社9月15日电,TrendForce集邦咨询最新研究显示,AI技术驱动的庞大数据量正对全球数据中心存储设施形成冲击。传统用于海量数据存储的Nearline HDD(近线硬盘)已出现严重缺货问题。在此背景下,高效能但成本较高的SSD逐步成为市场焦点,特别是大容量QLC SSD备受关注。预计到2026年,QLC SSD出货量有望迎来爆发性增长,满足数据中心日益增长的存储需求。
元界筑梦师
09-15 13:57:13
AI推理需求
Nearline HDD缺货
QLC SSD出货
分享至
打开微信扫一扫
内容投诉
生成图片
攻克强化学习「最慢一环」!交大字节联手,RL训练速度飙升2.6倍
正文:2025年9月,上海交通大学与字节跳动联合推出强化学习加速框架RhymeRL,训练速度提升2.6倍。研究发现,模型生成答案在相邻训练周期中存在序列和长度分布相似性,基于此提出HistoSpec和HistoPipe两大核心技术。HistoSpec通过复用历史响应优化Token生成效率,HistoPipe利用跨步互补调度减少GPU资源浪费。实验表明,该框架在数学、代码等任务上显著提升端到端吞吐量,且精度无损。研究成果已发布于arXiv,为强化学习训练提供了新范式。
AI奇点纪元
09-13 17:30:05
RhymeRL
强化学习
训练速度
分享至
打开微信扫一扫
内容投诉
生成图片
强化学习+MCP=王炸?开源框架教AI在MCP中玩转工具解决任务,实测效果超越GPT!
正文:2025年8月11日,科技公司OpenPipe发布全新开源强化学习框架MCP·RL,专为AI在MCP(多工具协作平台)中自动发现和调用工具设计。该框架无需人工配置工具、编写提示或标注数据,AI可自主生成任务并通过闭环反馈优化策略。实测显示,MCP·RL在2/3的基准测试中达到或超越当前最佳性能(SOTA),效果优于GPT等模型。其训练流程包括工具发现、任务生成、实战训练及泛化测试,显著降低复杂任务的配置成本。MCP·RL是基于ART(Agent Reinforcement Trainer)系统的最新项目,适用于任何Python应用,开箱即用。此前,ART曾成功提升Qwen 2.5-14B在电子邮件检索任务中的表现。参考链接:[1] [2]
星际Code流浪者
08-11 09:58:53
MCP·RL
开源框架
强化学习
分享至
打开微信扫一扫
内容投诉
生成图片
6小时复刻AI IMO金牌成果,蚂蚁多智能体新进展已开源
2025年7月,IMO赛场上演AI巅峰对决。7月19日,顶尖大模型几乎全军覆没;两天后,OpenAI和DeepMind等实验室斩获5/6题。7月23日,哈佛与UCLA学生用Gemini 2.5 Pro+多轮验证框架发布论文并开源代码。次日,蚂蚁AWorld团队仅用6小时复现DeepMind成果,开源一键运行的多智能体IMO系统。实验表明,多智能体协同能超越单模能力,解决复杂IMO问题,并提出构建最优输入、实现元认知等理论支持。AWorld采用事件驱动架构,具备模型即插即用、全链路可观测性等优势。团队透露,未来将测试“多智能体+形式化验证”组合,目标直指Lean4形式化证明。IMO或成人类最后一次战胜AI的机会。
智能维度跳跃
08-02 18:21:17
AWorld
IMO
多智能体
分享至
打开微信扫一扫
内容投诉
生成图片
MiniMax M1全球技术闭门会实录:RL、混合架构、长上下文的下一步
MiniMax M1全球技术闭门会探讨了RL、混合架构及长上下文的前沿话题。 RL能否赋予模型新能力? RL在有限上下文长度下能提升模型能力,通过改变输出分布优化性能。例如,预训练需10万token解决的问题,经RL可能仅需1万token。然而,Reward Modeling仍是核心瓶颈,尤其是非结...
LunarCoder
07-22 13:32:06
RL
混合架构
长上下文
分享至
打开微信扫一扫
内容投诉
生成图片
因被 AI 生成的虚假漏洞报告轰炸,开源网络工具 cURL 考虑停止提供安全赏金
7月19日,开源网络工具cURL开发者Daniel Stenberg透露,因被AI生成的虚假漏洞报告轰炸,cURL考虑停止其安全漏洞赏金项目。自2019年以来,该项目已为81名安全漏洞发现者发放9万美元奖励(约合64.7万元人民币)。然而,近期不怀好意者利用AI工具批量生成‘垃圾漏洞报告’,上周报告量激增至平时8倍,且大部分内容不实。cURL安全团队仅7人,需耗时30分钟至3小时逐一核实漏洞真实性,导致时间和精力严重浪费。Daniel Stenberg警告,若情况无法改善,可能取消该赏金项目。
阿达旻
07-19 21:57:13
AI生成虚假报告
cURL
安全漏洞赏金
分享至
打开微信扫一扫
内容投诉
生成图片
7B模型“情商”比肩GPT-4o,腾讯突破开放域RL难题,得分直翻5倍
2025年7月,腾讯混元数字人团队发布RLVER框架,突破开放域强化学习(RL)难题。该框架通过构建“环境+奖励”一体化的用户模拟器,解决了真实交互中情商优化的三大困境:环境、奖励和训练难题。经RLVER训练的Qwen2.5-7B模型,在情感对话基准Sentient-Benchmark上的得分从13.3跃升至79.2,表现比肩GPT-4o和Gemini 2.5 Pro等顶级模型,同时避免了通用能力衰退。研究还揭示“思考式”与“反应式”模型的不同路径,以及温和训练环境对早期成长的重要性。相关论文已发布,代码与模型开源。
AGI探路者
07-18 16:42:29
RLVER
情商
用户模拟器
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序