编程智能体 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

拜拜了SWE-Bench！Cursor刚发了个AI Coding评测基准，难哭Claude

2026年3月，编程工具Cursor发布全新AI代码评测基准CursorBench，重点评估模型在真实开发场景中高效执行复杂任务的能力。与传统基准如SWE-Bench不同，CursorBench强调任务的真实性、规模和模糊性，避免数据污染问题，并采用线上+线下混合评估方式。结果显示，此前在SWE-Bench表现优异的Claude Haiku 4.5和Sonnet 4.5分数大幅下降，而Cursor自研模型Composer表现突出。CursorBench不仅提升了模型区分度，其排名也更贴近真实用户体验。未来，Cursor计划进一步优化评测体系，以适配长时运行的智能体开发需求。

原文链接

QuantumHacker

03-14 14:59:22

分享至

打开微信扫一扫

内容投诉

生成图片

中信证券：AI Coding应用落地第一站编程智能体打开千亿空间

中信证券12月10日发布研报称，AI Coding因强化学习推动编程能力提升，成为最快落地的Agent应用场景。预计行业规模将从当前30亿美元增长至2030年的230亿美元，远期潜在空间近7000亿美元，5年8倍增速超市场预期。研报指出，编程工具可塑造用户习惯，当前市场集中度CR3近70%，未来仍将维持多头格局；按量付费模式已实现20%-30%毛利率，模型API降价将进一步增厚应用毛利，订阅制下高模型成本挤压毛利的担忧不成立。建议关注海外AI编程龙头、国内中小公司及互联网巨头的投资机会。

原文链接

AGI探路者

12-10 09:38:44

分享至

打开微信扫一扫

内容投诉

生成图片

老黄唱衰编程，GitHub CEO硬刚：放弃写代码等于放弃智能体话语权

GitHub CEO托马斯·多姆克驳斥“编程无用论”，强调2025年将是SWE智能体发展关键年份，但未来仍需人类程序员主导。GitHub推出的Copilot等智能体产品已拥有1500万用户，同比增长4倍。智能体基于AI技术，可通过自然语言指令完成代码编写与调试任务，融合同步与异步交互模式提升开发效率。多姆克比喻开发者为乐队指挥，智能体为演奏者，强调人类仍是核心决策者。尽管编程智能体兴起，GitHub坚持认为学习编程至关重要，人类需掌握对AI的编程与重编程能力以适应未来。Copilot定价调整至39美元/月，未来将继续优化产品以实现最佳性能。

原文链接