AI代码补全哪家强?两个新指标+一套新框架,让模型更懂开发者
如何让AI代码补全更懂开发者?中兴通讯团队提出了两个新指标和一套仓库级代码语料处理框架。这套方法不仅为评测代码大模型提供了新视角,也为提升模型在真实工业场景中的代码补全性能开辟了新路径。
目前,智能补全工具如GitHub Copilot极大提升了程序员的开发效率。然而,AI工具的建议常“差强人意”。团队认为,这反映了两个关键痛点:一是AI的“主观判断”与用户需求间的差距;二是多数模型缺乏对代码仓库整体结构和深层语义依赖的理解。
为解决这些问题,团队推出了两个新指标和一套框架。新指标LCP和ROUGE-LCP更贴近用户实际体验,强调代码补全建议开头部分的准确性。框架SPSR-Graph通过构建结构化知识图谱,让模型更好地理解代码仓库的整体结构。
实验表明,LCP和ROUGE-LCP能更准确反映用户采纳意愿,与采纳率的相关性优于传统指标。SPSR-Graph显著提升了模型在C/C++代码补全任务中的性能,尤其在C语言中,EM提升了2.66%,BLEU提升了2.74%。团队未来将进一步探索这些方法在更多任务和模型上的应用,以及与强化学习的结合。
原文链接
本文链接:https://kx.umi6.com/article/20140.html
转载请注明文章出处
相关推荐
.png)
换一换
AI代码补全哪家强?两个新指标+一套新框架,让模型更懂开发者
2025-06-12 16:38:36
Lovart正式发布推出ChatCanvas,想挑战Figma和Canva?
2025-07-25 11:21:34
37岁理工男,估值1000亿
2025-07-25 16:27:13
擎朗智能将在WAIC期间发布新款双足具身服务机器人
2025-07-25 20:30:59
特朗普:曾考虑拆分英伟达以促进AI芯片领域竞争 但发现并不容易
2025-07-25 11:24:10
云天畅想完成上亿美元D轮融资,梁溪数字母基金领投
2025-07-24 14:07:19
马斯克:超级充电餐厅的特斯拉人形机器人 Optimus 明年将晋升为送餐员
2025-07-24 16:11:26
世界互联网大会举行人工智能发展与治理交流会
2025-07-25 12:24:44
美国公布联邦土地AI数据中心项目首批选址 目标年内确定合作伙伴
2025-07-25 12:23:38
基于 DeepSeek 大模型,河南引入“AI 智审”系统实现货物口岸通关申报“秒级”筛查
2025-07-25 16:26:47
像素绽放完成B3轮融资,亦庄国投领投
2025-07-24 17:10:52
黄仁勋说一定会去杭州
2025-07-25 11:19:46
性能比肩 Gemini-2.5 pro、o4-mini:阿里通义千问 Qwen 3 推理模型超级进化,现已开源
2025-07-26 00:31:49
485 文章
80111 浏览
24小时热文
更多

-
2025-07-26 00:33:19
-
2025-07-26 00:31:49
-
2025-07-25 23:34:37