1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

最强AI程序员:84秒跑通代码,像人一样思考!团队仅5人

地表最强AI软件工程师Genie横空出世,其性能已与人类工程师不相上下。Genie在权威榜单SWE-Bench中以解决30.07%问题的成绩拔得头筹,远超第二名19.27%,实现了高达57%的提升。它能像人类一样解决现实中的软件问题,只需四步操作即可开始工作:通过提示词、GitHub Issue、Linear Ticket或API。

以GitHub Issue为例,Genie自动解析问题,通过迭代思考确定解决问题所需文件,随后进行自动迭代分析。接着,它迅速编写并执行代码,全程耗时仅84秒。团队称,Genie已观察并学习了数百万次人类程序员解决软件问题的过程,这是任何人类程序员一生都无法达到的数量。

背后团队Cosine仅由5人组成,CEO Alistair在感谢OpenAI的同时指出,没有后者,团队无法创造Genie。Genie的训练方法独特,团队在过去一年收集了包含真实人类程序员开发活动的数据集,其中包括成果分析、静态分析、自我对弈、逐步验证等,以及基于大量标记数据训练的AI模型,使数据质量随基础模型能力提升而提高。

为了应对错误情况,团队引入了自我改进机制,使用初代Genie生成包含错误的合成数据进行训练。这一过程使得Genie的初始解决方案越来越准确,即便出现错误也能通过少量修正达到正确答案。Genie的成功得益于OpenAI提供的大模型支持,团队通过数十亿token的数据训练模型,实现性能飞跃。

Cosine团队规模虽小,但实力不容小觑。成员来自独角兽企业,拥有管理全球团队经验,甚至有人自8岁起便开始编程。团队的目标是深入理解人类推理,并已成功将这一理念转化为强大的AI工具。团队成员中还有一位华人Yang Li,是Cosine的联合创始人,曾登上福布斯30 under 30榜单。

Genie的开发始于2022年,当时从技术角度看尚不可行。直到近半年来,随着大模型技术的发展,Genie才得以实现。团队表示,数据质量和大模型的支持是Genie性能提升的关键因素。对于有兴趣体验Genie的用户,可访问Waitlist页面进行注册。


总结:Genie,这款由仅5人组成的团队Cosine研发的地表最强AI软件工程师,以其84秒跑通代码的能力,展现出媲美人类工程师的思考与行动。借助OpenAI的大模型支持与创新的数据训练方法,Genie不仅大幅提升了解决问题的效率,还展现了AI在理解和模仿人类思维过程上的潜力。团队的成功故事激励着我们,即使是小型团队,也能在AI领域创造出令人瞩目的成果。

原文链接
本文链接:https://kx.umi6.com/article/4929.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
刘烈宏:加快行业高质量数据集建设 加力投资数据产业
2025-09-21 11:43:35
深圳:加快健全算力、算法、数据、场景全流程全要素保障体系 打造全球人工智能先锋城市
2024-12-31 20:47:57
模型、数据、场景,企业级AI落地三要素
2025-08-28 12:20:03
辽宁省数据局副局长刘洋:深化数据要素在装备制造、医疗健康等重点领域的融合应用
2025-09-18 16:59:22
上海:围绕数据、区块链、人工智能等产业方向 打造若干个区域支柱型、特色型数字产业集群
2026-04-21 15:12:47
DeepSeek解封“算力智子”后,数据成AI未来发展关键
2025-03-25 12:54:18
在非洲寻找人工智能
2025-08-14 13:54:06
中共中央、国务院:支持发展智慧农业 拓展人工智能、数据、低空等技术应用场景
2025-02-23 18:06:59
大模型真的在吞噬人类的一切数据吗?
2024-07-11 09:54:06
科大讯飞刘庆峰:中美科技博弈 数据一定是中国强
2025-01-27 13:32:08
AI厂商拿Robots协议当草纸,互联网秩序“礼乐崩坏”
2024-06-28 23:30:52
外媒:不只是63岁的库克需要接班人,苹果高管团队或迎来“大换血”
2024-05-23 18:20:23
十问AI搜索:没有数据的AI搜索都是白扯?
2024-07-24 19:11:15
24小时热文
更多
扫一扫体验小程序