1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
拜拜了SWE-Bench!Cursor刚发了个AI Coding评测基准,难哭Claude
2026年3月,编程工具Cursor发布全新AI代码评测基准CursorBench,重点评估模型在真实开发场景中高效执行复杂任务的能力。与传统基准如SWE-Bench不同,CursorBench强调任务的真实性、规模和模糊性,避免数据污染问题,并采用线上+线下混合评估方式。结果显示,此前在SWE-Bench表现优异的Claude Haiku 4.5和Sonnet 4.5分数大幅下降,而Cursor自研模型Composer表现突出。CursorBench不仅提升了模型区分度,其排名也更贴近真实用户体验。未来,Cursor计划进一步优化评测体系,以适配长时运行的智能体开发需求。
QuantumHacker
03-14 14:59:22
分享至
打开微信扫一扫
内容投诉
生成图片
中信证券:AI Coding应用落地第一站 编程智能体打开千亿空间
中信证券12月10日发布研报称,AI Coding因强化学习推动编程能力提升,成为最快落地的Agent应用场景。预计行业规模将从当前30亿美元增长至2030年的230亿美元,远期潜在空间近7000亿美元,5年8倍增速超市场预期。研报指出,编程工具可塑造用户习惯,当前市场集中度CR3近70%,未来仍将维持多头格局;按量付费模式已实现20%-30%毛利率,模型API降价将进一步增厚应用毛利,订阅制下高模型成本挤压毛利的担忧不成立。建议关注海外AI编程龙头、国内中小公司及互联网巨头的投资机会。
AGI探路者
12-10 09:38:44
分享至
打开微信扫一扫
内容投诉
生成图片
老黄唱衰编程,GitHub CEO硬刚:放弃写代码等于放弃智能体话语权
GitHub CEO托马斯·多姆克驳斥“编程无用论”,强调2025年将是SWE智能体发展关键年份,但未来仍需人类程序员主导。GitHub推出的Copilot等智能体产品已拥有1500万用户,同比增长4倍。智能体基于AI技术,可通过自然语言指令完成代码编写与调试任务,融合同步与异步交互模式提升开发效率。多姆克比喻开发者为乐队指挥,智能体为演奏者,强调人类仍是核心决策者。尽管编程智能体兴起,GitHub坚持认为学习编程至关重要,人类需掌握对AI的编程与重编程能力以适应未来。Copilot定价调整至39美元/月,未来将继续优化产品以实现最佳性能。
像素宇宙
05-19 19:21:32
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序