1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:AI助力大型代码库管理,开发者福音 | 阿里巴巴、新加坡国立大学、西安交大

AI在代码生成和补全方面展现出巨大潜力,但处理大规模、多文件代码库时,大语言模型(LLMs)面临挑战。为解决此问题,研究人员开发了CodexGraph,一个结合代码图数据库与语言模型的系统,旨在提高通用性和泛化能力。

研究方法

  1. 构建代码图数据库:利用静态分析技术,依据预定义的Schema,将代码库中的元素(如模块、类、函数)及其关系映射到图数据库中。
  2. 代码结构感知查询:运用灵活的图形查询语言和图数据库结构特性,实现复杂查询和深度检索。
  3. “Write then translate”策略:主语言模型(LM)分析问题,生成自然语言查询;专门的翻译LM将查询转换为格式化的图形查询语言。
  4. 迭代式管道:LM根据用户问题和现有信息,逐步优化查询和检索结果。

实验与应用

CodexGraph在多个基准测试(如CrossCodeEval、EvoCodeBench、SWE-bench)上表现出色,覆盖了跨文件代码补全、代码生成和自动化GitHub问题解决等任务。实验结果证实了代码图数据库作为语言模型与代码库接口的有效性。

研究发现,处理不同难度推理任务时,查询策略有所不同。在CrossCodeEval中,多重查询策略更优;而在SWE-bench中,单个查询策略效果更好。移除Cypher LM代理会增加主LM代理的推理负担,影响性能。

基于ModelScope-Agent框架,CodexGraph在多个场景下展现出实际应用价值,包括代码聊天助手、代码调试工具、单元测试生成器、代码生成器和代码注释工具。这些应用展示了CodexGraph在生产环境中的高效性和质量提升能力。

总结

CodexGraph通过代码图数据库为语言模型与代码库提供了一种新交互方式,显著提升了复杂代码库理解能力与整体代码检索导航的准确性。这一解决方案为自动化软件工程领域带来革新,尤其在应对检索辅助代码生成(RACG)挑战时展现出广泛潜力与实际价值。未来,CodexGraph有望支持更多编程语言,并进一步优化工作流程与索引构建效率。

代码链接:https://github.com/modelscope/modelscope-agent/tree/master/apps/codexgraph_agent

arXiv链接:https://arxiv.org/pdf/2408.03910

原文链接
本文链接:https://kx.umi6.com/article/4851.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
Manus补上一块短板,但Meta AI的短板实在太多了
2026-01-02 18:29:42
《阿凡达3》中国首映 导演卡梅隆:AI永远无法替代人的创作
2025-12-09 22:01:39
Meta 万亿豪赌「AI 未来」
2026-01-30 13:42:29
Omdia:AI 推动半导体行业收入在 2026 年首次突破 1 万亿美元大关
2026-01-16 12:34:51
算力,终于像电一样被「发明」出来了
2026-01-14 11:33:54
英伟达 CEO 黄仁勋:AI 不会直接“抢”走你的饭碗,而是会催生一些奇怪职业
2025-12-04 22:48:39
用一个字,证明你不是 AI
2026-01-02 17:25:05
马斯克最新大胆构想:借助 AI 与机器人解决美国债务危机
2025-12-01 16:21:52
浙江用AI抓出贪官
2026-01-14 23:03:37
快手怎么「隐身」了?
2025-12-01 16:19:37
动动嘴就能白嫖奶茶 千问请客把全网都整出年味了
2026-02-07 00:22:55
亚马逊力推 AI 遭超千名员工联署反对:越帮越忙,还带来更多工作量
2025-11-28 22:50:23
蓝色巨人IBM看空AI:8万亿美元回不了本 AGI可能性0-1%
2025-12-03 20:41:46
24小时热文
更多
扫一扫体验小程序