1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:AI助力大型代码库管理,开发者福音 | 阿里巴巴、新加坡国立大学、西安交大

AI在代码生成和补全方面展现出巨大潜力,但处理大规模、多文件代码库时,大语言模型(LLMs)面临挑战。为解决此问题,研究人员开发了CodexGraph,一个结合代码图数据库与语言模型的系统,旨在提高通用性和泛化能力。

研究方法

  1. 构建代码图数据库:利用静态分析技术,依据预定义的Schema,将代码库中的元素(如模块、类、函数)及其关系映射到图数据库中。
  2. 代码结构感知查询:运用灵活的图形查询语言和图数据库结构特性,实现复杂查询和深度检索。
  3. “Write then translate”策略:主语言模型(LM)分析问题,生成自然语言查询;专门的翻译LM将查询转换为格式化的图形查询语言。
  4. 迭代式管道:LM根据用户问题和现有信息,逐步优化查询和检索结果。

实验与应用

CodexGraph在多个基准测试(如CrossCodeEval、EvoCodeBench、SWE-bench)上表现出色,覆盖了跨文件代码补全、代码生成和自动化GitHub问题解决等任务。实验结果证实了代码图数据库作为语言模型与代码库接口的有效性。

研究发现,处理不同难度推理任务时,查询策略有所不同。在CrossCodeEval中,多重查询策略更优;而在SWE-bench中,单个查询策略效果更好。移除Cypher LM代理会增加主LM代理的推理负担,影响性能。

基于ModelScope-Agent框架,CodexGraph在多个场景下展现出实际应用价值,包括代码聊天助手、代码调试工具、单元测试生成器、代码生成器和代码注释工具。这些应用展示了CodexGraph在生产环境中的高效性和质量提升能力。

总结

CodexGraph通过代码图数据库为语言模型与代码库提供了一种新交互方式,显著提升了复杂代码库理解能力与整体代码检索导航的准确性。这一解决方案为自动化软件工程领域带来革新,尤其在应对检索辅助代码生成(RACG)挑战时展现出广泛潜力与实际价值。未来,CodexGraph有望支持更多编程语言,并进一步优化工作流程与索引构建效率。

代码链接:https://github.com/modelscope/modelscope-agent/tree/master/apps/codexgraph_agent

arXiv链接:https://arxiv.org/pdf/2408.03910

原文链接
本文链接:https://kx.umi6.com/article/4851.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
2025科技股IPO:Figma的逆袭与不成熟的AI故事
2025-07-16 17:06:58
詹姆斯・卡梅隆谈 AI:能和人类一样富有创造力,但无法拥有独特生活体验
2025-09-20 19:33:53
中泰证券:AI叠加消费电子国补 电子板块二季度或延续高增长
2025-07-17 08:19:03
那天,AI大模型想起了,被「失忆」所束缚的枷锁
2025-09-01 16:21:15
腾讯、阿里和小米在列!AI“六巨头”正引领今年新兴市场涨幅?
2025-08-18 11:45:29
AI正在改写地图APP!这一次轮到谷歌了
2025-10-21 08:20:12
柯洁回应与AI下棋:比一百盘被虐一百盘 AI要我水平低的数据是在污染自己
2025-09-07 09:43:21
苹果遭遇AI危机,供应商在逃离“果链”中进退两难
2025-07-21 18:21:33
开幕预告 | 双奖得主杰弗里辛顿领衔,全球AI群星在此闪耀!
2025-07-25 13:24:25
Glean完成1.5亿美元F轮融资,威灵顿资产领投
2025-07-23 15:55:37
AI唱主角!特斯拉发布“宏图4.0” 马斯克:未来80%价值来自机器人
2025-09-02 14:34:19
摩根士丹利Stan Delaney:下一轮投资机会将集中于借助AI开拓新兴业务的企业
2025-10-18 19:38:57
“作弊幽灵”就是AI超级入口
2025-07-26 00:33:19
24小时热文
更多
扫一扫体验小程序