综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2025年12月,OpenAI发布GPT-5.2,迅速反超谷歌Gemini 3 Pro,强化多项实用能力。新版在表格制作、PPT设计、代码编写、长文档理解等领域表现显著提升,视觉理解与工具调用能力也大幅增强。测试显示,GPT-5.2 Pro在ARC-AGI评测中得分90.5%,成本仅为11.64美元,效率较一年前提升390倍。其代码能力刷新纪录,在SWE-bench Verified上达80%准确率,长上下文处理接近100%准确率。此外,模型在科学辅助领域表现出色,GPQA Diamond评测得分93.2%。核心团队包括多位北大数院校友及数学专业背景的研究者,如Yu Bai、Yaodong Yu等,多为2024年后加入OpenAI的新成员。
原文链接
11月20日,国泰海通发布研报称,谷歌推出新一代大模型Gemini 3,实现多维度断层式领先。在核心推理能力测试中,Gemini 3在Humanity's Last Exam得分从21.6%提升至37.5%,并在ARC-AGI-2中以31.1%超越GPT-5.1(17.6%)近一倍,展现接近人类的抽象推理能力。新模型在复杂科学图表解析、动态视频理解及数学推理领域均取得突破性进展,为工程计算与金融分析提供可靠技术基础。此外,Gemini 3在代码生成与前端设计领域表现革命性进步,扭转谷歌编程竞赛劣势,并通过架构创新助力规模化商用。该模型还在智能体能力上实现飞跃,成为首个深度融合通用Agent能力的消费级基础模型,推动大模型竞争格局加速重构。
原文链接
2025年11月,谷歌发布Gemini 3 Pro模型,性能大幅提升,多项基准测试超越GPT-5.1和Claude 4.5,包括AGI测试ARC-AGI-2及AIME 2025数学考试满分。其在用户投票竞技场中迅速反超马斯克的Grok 4.1,引发奥特曼与马斯克点赞祝贺。Gemini 3不仅擅长编程、多模态处理,还能完成复杂现实任务,如模拟管理自动售货机实现高收益。谷歌同步推出智能体开发平台Google Antigravity,支持多模型协作,简化开发者工作流,已吸引大量开发者试用。此次更新还包括Gemini整合进搜索、独立APP上线,以及即将推出的Gemini 3 Deep Think模式。谷歌称预训练尚未结束,未来仍有改进空间。
原文链接
加载更多
暂无内容