1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

最强AI程序员:84秒跑通代码,像人一样思考!团队仅5人

地表最强AI软件工程师Genie横空出世,其性能已与人类工程师不相上下。Genie在权威榜单SWE-Bench中以解决30.07%问题的成绩拔得头筹,远超第二名19.27%,实现了高达57%的提升。它能像人类一样解决现实中的软件问题,只需四步操作即可开始工作:通过提示词、GitHub Issue、Linear Ticket或API。

以GitHub Issue为例,Genie自动解析问题,通过迭代思考确定解决问题所需文件,随后进行自动迭代分析。接着,它迅速编写并执行代码,全程耗时仅84秒。团队称,Genie已观察并学习了数百万次人类程序员解决软件问题的过程,这是任何人类程序员一生都无法达到的数量。

背后团队Cosine仅由5人组成,CEO Alistair在感谢OpenAI的同时指出,没有后者,团队无法创造Genie。Genie的训练方法独特,团队在过去一年收集了包含真实人类程序员开发活动的数据集,其中包括成果分析、静态分析、自我对弈、逐步验证等,以及基于大量标记数据训练的AI模型,使数据质量随基础模型能力提升而提高。

为了应对错误情况,团队引入了自我改进机制,使用初代Genie生成包含错误的合成数据进行训练。这一过程使得Genie的初始解决方案越来越准确,即便出现错误也能通过少量修正达到正确答案。Genie的成功得益于OpenAI提供的大模型支持,团队通过数十亿token的数据训练模型,实现性能飞跃。

Cosine团队规模虽小,但实力不容小觑。成员来自独角兽企业,拥有管理全球团队经验,甚至有人自8岁起便开始编程。团队的目标是深入理解人类推理,并已成功将这一理念转化为强大的AI工具。团队成员中还有一位华人Yang Li,是Cosine的联合创始人,曾登上福布斯30 under 30榜单。

Genie的开发始于2022年,当时从技术角度看尚不可行。直到近半年来,随着大模型技术的发展,Genie才得以实现。团队表示,数据质量和大模型的支持是Genie性能提升的关键因素。对于有兴趣体验Genie的用户,可访问Waitlist页面进行注册。


总结:Genie,这款由仅5人组成的团队Cosine研发的地表最强AI软件工程师,以其84秒跑通代码的能力,展现出媲美人类工程师的思考与行动。借助OpenAI的大模型支持与创新的数据训练方法,Genie不仅大幅提升了解决问题的效率,还展现了AI在理解和模仿人类思维过程上的潜力。团队的成功故事激励着我们,即使是小型团队,也能在AI领域创造出令人瞩目的成果。

原文链接
本文链接:https://kx.umi6.com/article/4929.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
谷歌、微软包下核电站“囤电”,AI技术之外的困境被低估了
2024-10-18 12:44:33
扒一扒o3-mini背后团队:3位华人核心成员,北大清华南开校友在列
2024-12-23 13:53:27
“现阶段就差数据了”,Figure 03登《时代》最佳发明榜封面,CEO放话了
2025-10-11 13:26:56
一文读懂:通用智能的本质是什么?
2024-08-29 17:38:24
数字中国建设峰会|奇安信集团齐向东:当“数据要素x”遇到“人工智能+”,如何安全释放数据价值?
2024-05-24 15:37:45
蚂蚁集团CTO何征宇: 大模型幻觉的源头是缺乏数据
2025-05-17 15:10:06
Agent+数据,会成为企业的新决策大脑吗?|直播预告
2025-06-25 19:32:39
辽宁省数据局副局长刘洋:深化数据要素在装备制造、医疗健康等重点领域的融合应用
2025-09-18 16:59:22
大模型真的在吞噬人类的一切数据吗?
2024-07-11 09:54:06
科技部部长阴和俊:强化算力、算法、数据等高效供给 全面实施人工智能+行动
2025-10-24 11:39:17
模型、数据、场景,企业级AI落地三要素
2025-08-28 12:20:03
AI厂商拿Robots协议当草纸,互联网秩序“礼乐崩坏”
2024-06-28 23:30:52
十问AI搜索:没有数据的AI搜索都是白扯?
2024-07-24 19:11:15
24小时热文
更多
扫一扫体验小程序