当地时间12月10日至15日,全球AI顶级会议NeurIPS在加拿大温哥华举行,涵盖机器学习、深度学习、神经网络等多个研究方向。本届会议共收到15671篇有效论文投稿,录取率为25.8%,略低于去年。来自中国的论文数量可观,包括中国人民大学、字节跳动、蚂蚁集团、腾讯等机构均有数十篇论文被收录。
蚂蚁集团此次共有20篇论文入选,其中一篇为特别关注的Spotlight论文。这篇论文介绍了名为KGL的新知识图谱语言,能够显著提升大语言模型(LLM)对知识图谱的理解能力。实验结果显示,通过KGL,LLM在知识图谱补全等任务上的表现显著优于传统方法。
此外,蚂蚁集团的另一篇论文《重新审视显存和通信成本对大语言模型高效数据并行训练的影响》提出了一种名为PaRO的优化器,通过更精细的分片策略加速LLM的训练,实验结果表明其速度比现有技术快266%。蚂蚁集团还在会议上举办了一场研讨会,探讨知识增强的LLM在行业垂直领域的应用前景。
这些成果体现了蚂蚁集团在提升AI经济性、可信性和效率方面的努力,也是其重点攻坚方向。会议期间发布的《AI产业实践六大趋势》报告指出,大模型在医疗、金融等专业领域的应用将显著提升生产力,并推动技术发展。同时,中国学术界和企业界在NeurIPS上的表现持续突破,期待未来继续取得更多成就。
原文链接
本文链接:https://kx.umi6.com/article/10046.html
转载请注明文章出处
相关推荐
换一换
挑战强化学习后训练霸权!全新无监督方法仅需1条数据+10步优化
2025-06-01 13:22:14
B站亮相 2024 世界人工智能大会,首次展出自研大语言模型
2024-07-05 20:57:56
荣耀 MagicOS 9.0 升级支持 30 亿参数端侧大语言模型:功耗下降 80%,内存占用减少 1.6GB
2024-10-23 16:40:26
科学家发现多数大语言模型测试标准存在缺陷,无法客观给出评分
2025-11-08 21:59:46
AI模型也能被“洗脑”!仅需250份文件就能控制ChatGPT回应
2025-10-19 22:55:33
DeepSeek之后,每一家公司都是Agent
2025-04-02 21:46:19
讲座预约 | AI4S 的前世今生:大语言模型与提示学习在科技研发中的应用与潜力丨GAIR Live
2024-09-12 09:43:52
arXiv创始人亲测:水论文这一块,Grok最强,Claude最不配合
2026-03-09 13:40:43
OpenAI 发布新模型 奥特曼:耐心时刻结束了
2024-09-16 01:58:25
图灵奖得主杨立昆:大语言模型发展已接近瓶颈,AI 仅靠文本训练无法实现人类级智能
2025-03-23 23:28:58
deepseek关联公司公布大语言模型部署方法专利
2025-08-01 14:04:10
大模型来了,你要裁员吗?
2024-07-12 08:41:18
AI模拟社会的“幕后”操控者是谁?
2025-01-21 14:39:42
640 文章
428777 浏览
24小时热文
更多
-
2026-03-09 21:13:27 -
2026-03-09 20:09:26 -
2026-03-09 20:09:18