
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
大模型自指:代码生成的递归式自我提升
近年来,研究表明通过“脚手架”程序多次调用语言模型,可显著提升输出质量。本研究提出一种名为“自学优化器”(Self-Taught Optimizer,STOP)的方法,利用语言模型驱动的脚手架改进自身。实验中,团队构建了一个“种子改进器”,通过多次调用模型生成候...
原文链接
8月29日,埃隆・马斯克旗下xAI公司发布全新智能代码生成模型Grok Code Fast 1,限时免费开放于Cursor、GitHub Copilot等主流编程平台。该模型专为快速、经济设计,擅长TypeScript、Python等多种语言,可高效处理编程任务。定价方面,输入token为每百万0.20美元,输出token为每百万1.50美元,缓存输入token为每百万0.02美元,性价比突出。xAI称其架构精简且性能强劲,适合低成本编码需求。与此同时,xAI本周一对苹果和OpenAI提起诉讼,指控其合谋遏制AI市场竞争。目前,微软、OpenAI等也在推进AI代码助手普及,微软透露其20%-30%代码由AI生成,OpenAI的Codex已向ChatGPT Plus用户开放。
原文链接
8月13日,微软宣布在Visual Studio中通过GitHub Copilot上线GPT-5模型。这一最新模型由OpenAI发布,具备显著提升的复杂任务推理与决策能力,可生成高质量、易维护的代码,并提供清晰的修改解释和灵活的自动化支持,有助于加速开发流程。然而,外界反应不一,有用户反馈GPT-5重构代码库后新增大量文件却无法运行。目前,付费GitHub Copilot用户将陆续收到更新,但因分阶段推送,可能无法立即使用。企业用户需管理员启用相关策略才能选择GPT-5,同时部分旧模型将逐步停用。
原文链接
标题:字节Seed发布扩散语言模型,推理速度达2146 tokens/s
字节Seed推出了一款基于扩散模型的代码生成工具——Seed Diffusion Preview。这款模型采用离散状态扩散技术,在推理速度上表现出色,每秒可生成2146个token,比同类模型快数倍,且较同等规模的自回归模...
原文链接
7月31日,字节跳动Seed团队发布实验性扩散语言模型Seed Diffusion Preview,专注于结构化代码生成领域。该模型推理速度达2146 tokens/s,比同等规模自回归模型快5.4倍,在多个基准测试中性能相当,并在代码编辑任务上实现超越。团队表示,离散扩散技术展现了推理加速潜力及解决复杂结构化推理问题的新可能性,未来将探索其规模化应用与深层价值。
原文链接
2025年7月27日,在世界人工智能大会上,宇树科技创始人王兴兴透露,AI技术已能高效生成代码,成功率高达90%以上,他本人也常用AI辅助编写代码。王兴兴表示,去年AI生成代码错误较多,但今年上半年性能显著提升。他还提到,宇树科技的终极目标是通过机器人解放人类生产力,目前正通过机器人跳舞、格斗等表演展示技术实力并创造商业价值。他认为,通用AI与通用机器人结合将成为未来科技主流,尽管人形机器人行业尚处早期阶段,但他呼吁外界给予更多耐心和支持。
原文链接
2025年7月,埃默里大学、佐治亚理工学院等联合发布全球首个医疗代码生成大模型训练平台MedAgentGym。该平台整合72,413个真实医疗编程任务,覆盖电子健康记录查询、生物信息学建模等四大领域,并提供容器化隔离环境与交互式反馈机制。基于此平台开发的开源模型Med-Copilot-7B通过两阶段训练后,在多项医疗编程任务上性能接近GPT-4o,达到59.90分。研究团队还引入AI验证器,显著提升模型成功率至42%,为未来医疗AI发展奠定基础。论文及代码已公开,项目有望加速医疗AI普惠化进程。
原文链接
2025年7月,Inception Labs推出基于扩散技术的全新大语言模型Mercury,突破自回归模型逐词生成限制,采用“从噪声到结构化输出”方式,一次性预测所有方向的token,速度比传统工具快10倍。在NVIDIA H100 GPU上,Mercury实现最高1109 tokens/秒吞吐量,并通过并行化生成、动态去噪调度等优化硬件利用效率。其双向注意力机制和实时纠错模块显著提升代码生成的灵活性与准确性。团队由斯坦福、UCLA等顶尖高校教授创立,拥有谷歌、微软等资深专家支持。然而,超快生成速度也暴露当前CI测试瓶颈,引发行业对开发流程优化的讨论。Mercury在线体验平台已开放供用户试用。
原文链接
7月5日,苹果公司在Hugging Face发布了一款名为DiffuCode-7B-cpGRPO的编程AI模型。该模型基于阿里开源的Qwen2.5-7B,采用扩散模型技术,能够不按顺序生成代码,性能媲美顶级开源编码模型。与传统自回归模型不同,DiffuCode通过调整采样温度(从0.2增至1.2),在生成代码时更加灵活,摆脱了从左到右的限制。苹果还利用超20000个精选编码示例对模型进行训练优化,使其更符合用户需求。测试显示,该模型在主流编程跑分中表现优异,相比其他扩散模型得分提升4.4%。
原文链接
2025年6月29日,设备仿真模拟软件QEMU宣布将拒绝接受由AI代码生成器生成的代码贡献,主要原因是潜在的版权问题。QEMU维护者Daniel Berrangé表示,目前关于AI代码生成器输出的许可合规性尚未形成统一共识,且存在利益冲突。根据开发者证书(DCO)要求,贡献者需明确声明其代码的合规性,而AI生成代码难以满足这一条件。因此,QEMU将不接受任何已知或疑似使用AI生成的代码。尽管AI辅助开发仍处于早期阶段,但项目方认为当前政策应保持严格,未来可根据情况调整。
原文链接
加载更多

暂无内容