1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
Grok-4登顶,Kimi K2非思考模型SOTA
2025年7月,AI大模型领域迎来新进展。xAI于7月10日发布Grok-4,登顶ScienceQA评测集,得分65.0,超越前代及OpenAI的o3模型,成为SOTA模型,性能与成本优势显著。Moonshot AI于7月11日推出开源Kimi K2模型,参数量达1万亿,在Non-Thinking模式中表现最佳,BoN得分73.0。此外,OpenAI的o3-pro、Google的Gemini 2.5 Pro等主流模型均更新版本,性能小幅提升但成本增加。xbench最新榜单显示,国产模型如DeepSeek、Doubao-Seed-1.6和Kimi K2在性价比和能力上表现出色,为开发者提供更多选择。整体来看,推理模型趋向高分高成本,而部分模型在性能与延迟间实现平衡。更多实时信息可关注xbench.org。
Nebula
07-18 12:38:47
Grok-4
Kimi K2
ScienceQA
分享至
打开微信扫一扫
内容投诉
生成图片
地表最贵AI诞生,年费2.1万,自称学术能力超人类博士
北京时间7月10日,马斯克旗下xAI公司发布Grok-4系列模型,尽管比原计划晚一小时。马斯克称其为“世界上最好的AI”,并表示在学术问题上,Grok-4能超越人类博士水平,有望年内带来科学突破,明年或发现新物理现象。Grok-4在多项基准测试中领先,解决率达50%,推理、编码和数学竞赛表现优异。订阅费最高300美元/月,年费约2.1万元人民币。xAI还升级了语音模式,未来将弥补图像理解短板,并计划推出编程、多模态及视频生成模型。特斯拉固件已嵌入Grok全功能版本,未来或与Optimus机器人结合。xAI团队华人占比近半,包括联合创始人Greg Yang和吴宇怀等核心成员。
AI幻想空间站
07-10 17:27:58
Grok-4
xAI
马斯克
分享至
打开微信扫一扫
内容投诉
生成图片
马斯克Grok-4碾压所有大模型!“比所有博士聪明”,AIME25拿满分
2025年7月10日,马斯克发布Grok-4模型,称其为“世界最强”大模型。Grok-4在多项考试中表现优异,如AIME25拿满分,‘人类最后考试’上首次突破50%准确率,达50.7%,远超普通人类(约5%)。马斯克称其比所有博士生聪明,裸考SAT和GRE几乎满分,并预计明年带来物理学新发现。Grok-4还在GPQA、HMMT等基准测试中名列前茅,展示了强大的推理、编程及多模态能力。此外,特斯拉固件已内置Grok,未来或成车载语音助手,同时将用于擎天柱机器人。发布会推迟1小时,团队中亚洲面孔占半数。订阅服务SuperGrok定价30美元/月。
智能维度跳跃
07-10 16:23:20
Grok-4
大模型
马斯克
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序