综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2月13日,谷歌母公司Alphabet因发布升级版双子座3号(Gemini 3)“深度思考”(Deep Think)推理模式,股价在盘中交易一度上涨1.7%,达到高点。该模式面向谷歌AI超级用户和部分API用户,专注于科学与工程领域的应用场景,引发市场积极反应。这一更新展示了Alphabet在人工智能领域的持续创新,进一步提振投资者信心。
原文链接
12月5日,谷歌推出面向Gemini Ultra订阅用户(月费249.99美元)的Gemini 3 Deep Think模式。该模式通过调用更多计算资源和全新技术架构,显著提升复杂数学、科学及逻辑问题的推理能力。在行业基准测试中表现卓越,例如Humanity’s Last Exam获41%高分,GPQA Diamond科学测试达93.8%,ARC-AGI-2代码测试取得45.1%成绩。其核心采用先进并行推理技术,可同时探索多种假设路径以求最优解。此前,该模型变体已在IMO和ICPC竞赛中达到金牌标准。此次公测被视作对OpenAI的有力回击,后者虽曾声称具备类似能力但尚未开放产品。业界预测,此举或将加速大模型领域‘推理能力之战’升级。
原文链接
2025年12月5日,谷歌正式上线其最新模型Gemini 3 Deep Think,主打复杂推理能力,可将草图转化为3D场景、生成精细程序等。该模型在多项基准测试中表现优异,例如Humanity’s Last Exam准确率达41%,ARC-AGI-2代码执行准确率高达45.1%,远超GPT-5 Pro和Gemini 3 Pro。然而,其仅向Ultra会员开放,月费249.9美元(约合人民币1800元),引发用户不满,Pro用户尤其批评缺乏试用机会。与此同时,开源模型DeepSeek-V3.2近期同样取得显著成绩,且完全免费,进一步凸显谷歌高价策略的争议性。行业评论认为,开源模型正对闭源产品形成冲击,谷歌此举或面临市场冷遇。
原文链接
谷歌DeepMind推出的Gemini 2.5 Deep Think模型现已在Gemini App上线,该模型曾获IMO金牌。新版速度更快,但实力略逊于原版,可达到IMO铜牌水平。模型仅对Ultra订阅用户开放,月费约1803元人民币。DeepMind称其推理性能超越OpenAI的o3和马斯克的Grok 4,在代码性能和科学知识测试中表现最佳。优势包括迭代开发、科学数学发现、算法编写等。通过扩展并行“思考时间”,模型能生成多种想法并优化解决方案。团队还开发了强化学习技术提升性能,模型还可融合多篇论文观点,助力研究。参考链接已附上。
原文链接
8月1日,谷歌正式发布Gemini 2.5 Deep Think模型,现已向Google AI Ultra订阅用户开放。该模型在多个基准测试中超越OpenAI的o3和xAI的Grok 4,性能显著提升。Deep Think模式可在作答前综合多个假设进行推理,并集成代码执行与谷歌搜索等功能。谷歌透露,该模型是此前在国际数学奥林匹克竞赛中获金牌模型的优化变体,虽经加速优化,但在2025年IMO基准测试中仅达铜牌水平。目前,用户可在Gemini应用中限定次数使用Deep Think功能,未来几周还将通过Gemini API向开发者提供不同版本。
原文链接
7月22日,谷歌宣布其升级版Gemini AI在国际数学奥林匹克竞赛(IMO)测试中取得金牌水平成绩。该模型成功解决了六道题目中的五道,采用DeepMind最新改进的并行思维技术与强化学习方法,显著提升多步推理和问题解决能力。此前,OpenAI的实验性模型也在相同测试中达到金牌标准。两项AI均在无工具、无联网条件下完成考试,并以自然语言书写证明。谷歌计划将此模型提供给受信任测试者试用,并逐步开放给订阅用户。
原文链接
加载更多
暂无内容