Grok-4 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

Grok-4登顶，Kimi K2非思考模型SOTA

2025年7月，AI大模型领域迎来新进展。xAI于7月10日发布Grok-4，登顶ScienceQA评测集，得分65.0，超越前代及OpenAI的o3模型，成为SOTA模型，性能与成本优势显著。Moonshot AI于7月11日推出开源Kimi K2模型，参数量达1万亿，在Non-Thinking模式中表现最佳，BoN得分73.0。此外，OpenAI的o3-pro、Google的Gemini 2.5 Pro等主流模型均更新版本，性能小幅提升但成本增加。xbench最新榜单显示，国产模型如DeepSeek、Doubao-Seed-1.6和Kimi K2在性价比和能力上表现出色，为开发者提供更多选择。整体来看，推理模型趋向高分高成本，而部分模型在性能与延迟间实现平衡。更多实时信息可关注xbench.org。

原文链接

Nebula

07-18 12:38:47

分享至

打开微信扫一扫

内容投诉

生成图片

地表最贵AI诞生，年费2.1万，自称学术能力超人类博士

北京时间7月10日，马斯克旗下xAI公司发布Grok-4系列模型，尽管比原计划晚一小时。马斯克称其为“世界上最好的AI”，并表示在学术问题上，Grok-4能超越人类博士水平，有望年内带来科学突破，明年或发现新物理现象。Grok-4在多项基准测试中领先，解决率达50%，推理、编码和数学竞赛表现优异。订阅费最高300美元/月，年费约2.1万元人民币。xAI还升级了语音模式，未来将弥补图像理解短板，并计划推出编程、多模态及视频生成模型。特斯拉固件已嵌入Grok全功能版本，未来或与Optimus机器人结合。xAI团队华人占比近半，包括联合创始人Greg Yang和吴宇怀等核心成员。

原文链接

AI幻想空间站

07-10 17:27:58

分享至

打开微信扫一扫

内容投诉

生成图片

马斯克Grok-4碾压所有大模型！“比所有博士聪明”，AIME25拿满分

2025年7月10日，马斯克发布Grok-4模型，称其为“世界最强”大模型。Grok-4在多项考试中表现优异，如AIME25拿满分，‘人类最后考试’上首次突破50%准确率，达50.7%，远超普通人类（约5%）。马斯克称其比所有博士生聪明，裸考SAT和GRE几乎满分，并预计明年带来物理学新发现。Grok-4还在GPQA、HMMT等基准测试中名列前茅，展示了强大的推理、编程及多模态能力。此外，特斯拉固件已内置Grok，未来或成车载语音助手，同时将用于擎天柱机器人。发布会推迟1小时，团队中亚洲面孔占半数。订阅服务SuperGrok定价30美元/月。

原文链接