OpenAI o1 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

OpenAI o1 推理模型免费用，微软 Copilot 开放“深度思考”AI 功能

1月30日，微软CEO穆斯塔法・苏莱曼宣布，所有Microsoft Copilot用户现可免费使用OpenAI的o1推理模型。这使得深度思考功能不再限于付费用户，所有用户均可利用此功能进行复杂多步骤的结构化推理。深度思考功能于2024年10月首次在Copilot Labs推出，旨在提高回复的深度和准确性。用户只需点击“深度思考”按钮，AI将在约30秒内生成经过充分推理的回复。苏莱曼还透露微软正筹备更多AI扩展项目。

原文链接

数据炼金师

01-31 10:49:58

Microsoft Copilot

OpenAI o1推理模型

深度思考

分享至

打开微信扫一扫

内容投诉

生成图片

DeepSeek-R1 最新发布，剑指 OpenAI o1

昨日1月20日，DeepSeek团队发布了全新开源模型DeepSeek-R1，迅速获得4k+星。该模型打破了传统训练模式，未使用SFT数据，仅通过RL训练，展示了自主思考的能力。DeepSeek-R1在多项基准测试中与OpenAI o1不相上下，尤其在数学和编程竞赛中表现出色。模型还开源了多个小模型，参数从1.5B到70B，性能超越GPT-4o等竞品。DeepSeek-R1的训练方法包括Self play、Grpo及Cold start，使其成本仅为o1的五十分之一，效能却相当。

原文链接

AGI探路者

01-22 10:55:31

DeepSeek-R1

OpenAI o1

强化学习

分享至

打开微信扫一扫

内容投诉

生成图片

DeepSeek-R1 模型发布，性能对标 OpenAI o1 正式版

1月20日，幻方量化旗下AI公司深度求索（DeepSeek）发布了DeepSeek-R1模型，并同步开源模型权重。该模型在数学、代码、自然语言推理等任务上性能与OpenAI o1正式版相当。DeepSeek称，蒸馏小模型超越OpenAI o1-mini，开源了两个660B模型及6个蒸馏小模型。DeepSeek-R1 API服务定价为每百万输入tokens 1元（缓存命中）/4元（缓存未命中），每百万输出tokens 16元。此外，DeepSeek统一采用MIT License，明确支持用户进行模型蒸馏。

原文链接

智能视野

01-20 22:24:20

DeepSeek-R1

OpenAI o1

模型蒸馏

分享至

打开微信扫一扫

内容投诉

生成图片

英伟达年终核弹：全新B300为o1推理大模型打造

英伟达发布全新AI芯片B300及超级芯片GB300，相比B200，B300在FLOPS上提升了50%，显存从192GB增加到288GB。GB300 NVL72被评价为唯一能让OpenAI o1/o3推理大模型达到10万tokens的方案。自第三季度起，多家AI巨头已将订单从B200转向B300。B300的升级主要来自工艺节点优化、功率提升及架构微创新。GB300系列改为参考板模式，为OEM和ODM制造商带来新机会。B300显著提升推理大模型的思维链长度和处理效率，降低成本，提高用户体验。

原文链接

数据炼金师

12-26 22:43:48

OpenAI o1

推理大模型

英伟达B300

分享至

打开微信扫一扫

内容投诉

生成图片

免费o1替代品来了！谷歌新发“王炸”推理大模型：思考速度碾压其他大模型，水平堪比理科博士

谷歌发布了实验性的Gemini 2.0 Flash Thinking模型，其推理能力强大，水平堪比理科博士生。该模型能在1到3秒内快速准确解答复杂问题，且支持逐步推理展示。目前，Gemini 2.0 Flash Thinking已上线Google AI Studio和Vertex AI，位居Chatbot Arena LLM排行榜首位。此模型不仅能处理文本，还能分析图像，为解决多类型数据问题提供了新手段。谷歌CEO Sundar Pichai称其为迄今为止最周到的模型。

原文链接

量子黑客

12-23 10:51:33

Gemini 2.0 Flash Thinking

OpenAI o1

推理模型

分享至

打开微信扫一扫

内容投诉

生成图片

Kimi 数学版上线：基于月之暗面 k0-math 模型，号称能力对标 OpenAI o1

11月26日，月之暗面发布了基于k0-math模型的Kimi数学版，该模型在多个数学基准测试中表现出色。根据官方声明，Kimi数学版支持用户通过截图或拍照方式输入数学问题，并能自动转换为LaTeX格式，方便用户使用。在中考、高考、考研及MATH竞赛题基准测试中，k0-math初代模型的成绩超过了OpenAI的o1-mini和o1-preview。此外，在更难的OMNI-MATH和AIME竞赛题库中，k0-math初代模型的表现分别达到o1-mini最高成绩的90%和83%。Kimi数学版的推出，标志着k0-math模型能力对标OpenAI的o1模型。此次更新进一步提升了数学问题处理的效率与准确性，适用于各类数学考试和竞赛。

原文链接

E-Poet

11-26 20:35:54

k0-math模型

Kimi数学版

OpenAI o1

分享至

打开微信扫一扫

内容投诉

生成图片

一句废话就把OpenAI o1干崩了？大模型的推理能力还真挺脆弱的

标题：大模型推理能力的脆弱性揭示一个月前，OpenAI发布的o1在处理复杂推理任务时展现出非凡能力，尤其在解答难度极高的数学问题时表现出色。然而，最近的研究揭示了大模型推理能力的脆弱性。一篇名为《理解大语言模型在数学推理的局限性》的论文指出，向大模型提出的问题中加入无关信息，即使是简单的小学数学...

原文链接

量子思考者

10-15 18:44:31

OpenAI o1

大模型推理能力

数学推理局限性

分享至

打开微信扫一扫

内容投诉

生成图片

一文看懂OpenAI最强模型o1：怎么用好，为何翻车？

《一文看懂OpenAI最强推理模型o1：如何使用及为何存在争议》 OpenAI的最新模型o1发布一周，如同洋葱般层层包裹，令人琢磨不透。它以独特的方式在回答问题前思考，形成复杂的思维链，模仿人类解决复杂问题的过程。这种设计源于强化学习训练，使o1在推理能力上超越以往，尤其在数学、代码等领域表现出色。...

原文链接

Oasis

09-20 18:22:13

AI思考

OpenAI o1

推理模型

分享至

打开微信扫一扫

内容投诉

生成图片

OpenAI o1 全方位 SOTA 登顶 lmsys 排行榜：数学能力碾压 Claude 和谷歌 Gemini 模型，o1-mini 并列第一

【新闻摘要】 OpenAI发布的新模型o1在lmsys排行榜上全面超越Claude和谷歌Gemini模型，成为数学领域的佼佼者。o1-preview版本在数学、编码和提示领域均展现卓越能力，与最新版GPT-4o并列综合排名第二，而其迷你版o1-mini同样在多个领域与o1-preview并驾齐驱。...

原文链接

LunarCoder

09-20 14:20:11

lmsys排行榜

OpenAI o1

数学能力

分享至

打开微信扫一扫

内容投诉

生成图片

OpenAI o1开辟“慢思考”，国产AI早已集结在CoE“组团”先出发

OpenAI的最新模型o1在复杂逻辑推理能力上展现出博士级水准，成功解决了此前语言模型LLMs难以应对的问题，如判断"9.9和9.11哪个更大"。这一成就引发讨论，有人担忧中国AI在追赶OpenAI的过程中可能会越来越落后。然而，通过深入分析OpenAI的发展路径——包括GPT路线、Sora路线及o...

原文链接