
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
GPT-4.5刚登顶竞技场6小时后被马斯克的Grok-3以总分1412:1411逆袭,仅差一分。Grok-3在总体带风格控制和困难提示词带风格控制方面略胜一筹。DeepSeek-R1总分第六,数学和困难提示词带风格控制分项与GPT-4.5并列第一。有用户质疑6小时内的巨大变化,解释称这与投票门槛有关。GPT-4.5口碑逐渐改善,用户开始称赞其情商,并且有人请求官方承诺不会下架该模型。此外,GPT-4.5还在一个类似大模型狼人杀的另类榜单上表现出色,各方面均领先于人类。
原文链接
OpenAI的GPT-4.5刚登顶竞技场,6小时后就被xAI的Grok-3以1分优势反超,两者票数均为3000+,总分1412:1411。Grok-3在总体带风格控制、困难提示词带风格控制方面略逊于GPT-4.5。DeepSeek-R1总分第6,数学和困难提示词带风格控制与GPT-4.5并列第一。有用户质疑6小时内变化是否合理,解释称大模型竞技场有投票门槛。GPT-4.5口碑有所改善,用户开始称赞其情商。奥尔特曼表示收到邮件请求承诺不下架该模型,并分享了与GPT-4.5的对话记录。此外,GPT-4.5还在一个类似大模型狼人杀的另类榜单中表现出色。
原文链接
北京时间2月18日,马斯克创立的xAI发布Grok-3系列模型,全球首个在十万卡集群上训练的大模型。Grok-3在数学、理科和代码测试中超越了多个头部模型,性能显著提升。xAI预计Grok-2将在几个月后开源。Grok-3将首先推广给推特Premium Plus用户,每月40美元。xAI还发布了DeepSearch产品,预计订阅费用每月30美元。Grok-3的性能提升归因于庞大的算力投入和多种训练方法。尽管成本有待优化,Grok-3有望解锁更多AI应用场景。
原文链接
标题:马斯克的Grok-3,水平如何?
昨天,马斯克发布了备受期待的Grok-3。尽管国内自媒体纷纷吹捧,但我们需要客观分析其真实水平。
Grok-3尚未全面开放,现有评测有限。官方数据显示,Grok-3的性能仅比第二名的gemini-2.0高出1.4%。虽然Grok-2表现不佳,但Grok-3的提升幅度与投入的20万张GPU相比显得不足。
我们不能完全依赖官方数据。去年,一家中国AI公司也曾高分低能,最终被揭露为特定优化所致。
Andrej Karpathy的评测较为中肯。他认为Grok-3接近OpenAI最强模型的水平,但未展现出显著优势。他同时指出,模型具有随机性,需更多评估。
网友反馈显示,Grok-3编写代码能力尚待提高,有人质疑测试的公平性。
总体来看,Grok-3展示了潜力,但仍处于测试阶段,缺乏重大突破。尽管如此,OpenAI的领先地位正在受到挑战,未来竞争将更加激烈。
原文链接
2月18日,马斯克的xAI公司发布了新一代推理模型Grok-3,性能比前代提升一倍,在数学、科学逻辑推理及代码写作方面优于Gemini-2 pro、GPT-4o和DeepSeek-V3。发布会中,两位华人创始团队成员坐镇“C位”,其中一位是吴宇怀,他曾就读于杭州建兰中学,后在多伦多大学获得博士学位,并在斯坦福大学完成博士后研究。吴宇怀致力于打造能够解决所有数学难题的AI,旨在创造自动化AI‘数学家’。
原文链接
北京时间2月18日,马斯克和xAI发布了最新旗舰模型Grok-3系列及聊天机器人Grok。Grok-3展示了强大的模型能力,在推理、数学、代码等领域取得突破。xAI团队表示,Grok-3使用了20万张GPU,算力超过DeepSeek-V3百倍。Grok-3在AIME和LMSYS测试中表现出色,超越了o3-mini和o1等顶级模型。xAI计划推出语音和多模态交互功能,并成立AI游戏社区。Grok-3初期仅向X平台Premium+订阅用户开放,价格为每月30美元或每年300美元。xAI正在以750亿美元估值筹集100亿美元资金,团队核心成员来自Google DeepMind、特斯拉、OpenAI等公司。
原文链接
2月18日,xAI发布了全新推理模型Grok-3,马斯克称其性能较前代提升了十倍。在数学、科学逻辑推理和代码写作方面,Grok-3的表现优于Gemini-2 pro、GPT-4o和DeepSeek-V3。然而,发布会现场更吸引眼球的是两位华人创始团队成员:Tony吴宇怀和Jimmy Ba。
吴宇怀,...
原文链接
2月18日,xAI推出名为Deepsearch的Grok-3智能搜索引擎。IT之家正在整理更多细节内容,稍后更新。关注IT之家获取最新消息,享受最快的大事件和焦点热点报道。
原文链接
xAI的Grok-3 AI有望下周发布,据testingcatalog报道,该模型已在独立平台和X平台短暂亮相并开启内部测试。测试显示Grok-3在回答问题方面的表现超越了OpenAI o1和DeepSeek R1等模型。xAI公司希望Grok-3能基于事实和真理,从基本原则理解世界,形成理性和怀疑的观点。系统提示词强调以用户为中心,优先提供数据、证据和统计数据支持答案,并倾向于使用X平台作为主要信息来源。Grok-3或将成为迄今为止最先进的AI模型。
原文链接
特斯拉及关联公司xAI创始人马斯克宣布,他们即将于年底发布Grok-3大语言模型,该模型使用了10万块英伟达H100 AI芯片进行训练,每块芯片价值约21.9-29.2万元人民币。这相当于xAI此次投入30-40亿美元(约218.68-291.57亿元人民币),训练成本巨大。马斯克此前预计特斯拉今年从英伟达采购额将达到相似规模。Grok-2模型计划8月推出,展现了xAI对先进AI技术的追求。
原文链接
加载更多

暂无内容