1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

近日,微软研究院发布研究显示,目前最先进的AI编程助手在调试软件漏洞方面的表现令人失望。研究测试了包括Claude 3.7 Sonnet和o3-mini在内的多款AI模型,它们在SWE-bench Lite基准测试中的成功率普遍低于50%,其中Claude 3.7 Sonnet的成功率最高,仅为48.4%。研究人员指出,数据稀缺是主要原因,特别是缺乏人类调试过程的详细数据。尽管AI编程助手已在谷歌和Meta等公司广泛应用,但其在理解工具使用及逻辑推理上的不足仍需改进。该研究提醒开发者谨慎依赖AI完成复杂编程任务。此前,微软联合创始人比尔·盖茨等人也质疑AI完全取代编程工作的可能性。研究发表于近期,揭示了AI辅助编程技术面临的持续挑战。

原文链接
本文链接:https://kx.umi6.com/article/17076.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
让编程更简单,豆包MarsCode面向开发者免费开放
2024-07-03 15:22:51
收入4个月涨2倍,“最火AI编程神器”Cursor估值达百亿美元
2025-03-10 09:26:47
AI编程助手公司Anysphere收到投资邀约 估值约25亿美元
2024-11-07 15:02:46
24小时热文
更多
扫一扫体验小程序