2025年9月,Gimlet Labs研究发现,AI可自动生成苹果设备的Metal内核,并显著提升PyTorch推理速度。实验显示,AI生成内核在215个PyTorch模块上实现平均1.87倍加速,部分工作负载甚至快数百倍。研究人员使用Mac Studio(Apple M4 Max芯片)和PyTorch eager模式作为基准,测试了Anthropic、DeepSeek和OpenAI等模型。AI生成内核正确性随尝试次数增加而提高,第5次尝试时可达94%。智能体群体策略进一步优化性能,平均加速31%,特定层级达42%。研究强调其目标是验证AI生成内核的可行性,而非追求极限性能,展现自动化内核工程的潜力。
原文链接
本文链接:https://kx.umi6.com/article/24744.html
转载请注明文章出处
相关推荐
换一换
AI生成苹果Metal内核,PyTorch推理速度提升87%
2025-09-05 11:17:03
英伟达自毁CUDA门槛!15行Python写GPU内核,性能匹敌200行C++
2025-12-08 14:30:13
端侧AI更安心!天玑9500强大双NPU:实现智能体验与隐私安全兼得
2025-12-08 11:25:48
央视起底 AI 带娃现象,专家称沉迷或阻碍低龄儿童认知发育
2025-12-06 16:37:45
打工15年,被大厂裁4次了
2025-12-08 11:21:19
华为面向医疗领域发布 AI 数据平台,涵盖知识生成与检索等
2025-12-07 18:40:26
编程界“奥斯卡”百度之星决赛揭晓,上千选手激烈角逐,山东16岁中学生王茂骅夺冠!
2025-12-08 16:34:59
罗永浩谈豆包手机被部分App封杀:事情比想象的要复杂得多
2025-12-08 11:26:56
英伟达 4B 小模型击败 GPT-5 Pro!单任务成本仅后者 1/36
2025-12-08 16:36:14
重庆“十五五”规划建议:建设“人工智能+”市域开源新生态 迭代完善人工智能政策体系
2025-12-08 08:18:03
厦门“十五五”规划建议:强化算力、算法、数据等高效供给 发展壮大数字经济核心产业
2025-12-08 14:32:20
工信部召开务虚会 研究谋划“十五五”及开局之年工作
2025-12-07 15:35:49
继微信出现“被动下线”之后,阿里系 App 禁止豆包手机登录
2025-12-06 21:52:11
601 文章
346359 浏览
24小时热文
更多
-
2025-12-08 19:45:13 -
2025-12-08 19:43:05 -
2025-12-08 18:41:52