推理模型 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

林俊旸离职后首次发声！复盘千问的弯路，指出AI的新路

林俊旸离职后首次发声：复盘千问弯路，展望AI新方向林俊旸在离职阿里千问后首次公开发声，未谈及离职细节或未来去向，而是聚焦于技术反思与AI未来。他坦言千问团队“没有全做对”，并指出过去两年推理模型时代的使命已完成，下一步应转向“智能体式思维”（Agentic Thinking）。千问团队曾尝试将“...

原文链接

小阳哥

03-27 15:02:31

分享至

打开微信扫一扫

内容投诉

生成图片

OpenAI推理第一人离职，7年打造了o3/o1/GPT-4/Codex

2026年1月6日，OpenAI研究副总裁Jerry Tworek宣布离职，他曾是GPT-4、o1推理模型及Codex等关键项目的核心贡献者。Jerry在OpenAI工作近七年，主导了多项突破性研究，包括大语言模型的推理能力开发和首个AI编程模型Codex。他表示，离职是为了探索在OpenAI难以开展的研究领域，并回顾了在公司经历的美好与疯狂时刻。他的离职引发广泛讨论，网友纷纷表达感谢与赞叹，也有部分人对OpenAI重要人才流失表示遗憾。Jerry的职业生涯始于数学与量化研究，后转向强化学习与AI研究，其贡献深刻影响了AI技术发展。

原文链接

智能视野

01-06 14:06:10

分享至

打开微信扫一扫

内容投诉

生成图片

美团发布高效推理模型 LongCat-Flash-Thinking，达到 SOTA 水平

9月22日，美团LongCat团队发布全新高效推理模型LongCat-Flash-Thinking，综合性能达全球开源模型最先进水平（SOTA）。该模型在逻辑、数学、代码及智能体任务中表现卓越，是国内首个结合“深度思考+工具调用”与“非形式化+形式化”推理能力的语言模型。通过创新架构如领域并行强化学习和异步弹性共卡系统，模型实现高效推理与稳定训练，在复杂任务中显著优化资源利用。多项权威评测显示，其在ARC-AGI、HMMT、LiveCodeBench等基准测试中刷新纪录，超越OpenAI o3、Gemini2.5 Pro等顶尖模型。项目已开源，地址包括Hugging Face与Github。

原文链接

阿达旻

09-22 15:58:35

分享至

打开微信扫一扫

内容投诉

生成图片

xAI推出Grok 4 Fast

9月22日，马斯克旗下xAI宣布推出Grok 4 Fast，这是一款更快、更高效的推理模型。相比Grok 4，Grok 4 Fast在性能相似的情况下，平均使用的思考Token减少了40%，计算速度更快且价格降低了98%。此外，该模型在前沿基准测试中表现出与Grok 4相同的性能水平。这一发布标志着xAI在优化AI模型效率和降低成本方面取得重要进展，为用户带来更高效、经济的解决方案。

原文链接

智能涌动

09-22 08:57:17

分享至

打开微信扫一扫

内容投诉

生成图片

揭秘：OpenAI是如何发展出推理模型的？

标题：揭秘：OpenAI如何发展推理模型？正文： ChatGPT的爆火看似偶然，但背后却是OpenAI多年深思熟虑的结果。科技媒体Techcrunch的深度文章揭示了OpenAI从数学竞赛到“通用AI智能体”的宏大愿景，其核心是对AI“推理”能力的终极探索。意外的起点是数学。2022年，...

原文链接

元界筑梦师

08-04 18:05:57

分享至

打开微信扫一扫

内容投诉

生成图片

GPT-5 难产内幕曝光：核心团队遭挖空，推理魔咒难破，靠英伟达续命

2025年8月初，外媒曝光GPT-5开发内幕：核心团队被小扎挖角致内部混乱，推理模型技术瓶颈让项目一度停滞。Orion模型因性能不佳降级为GPT-4.5，且GPT-5未达GPT-3到GPT-4级别的跃迁。尽管如此，OpenAI获83亿美元融资，估值达3000亿美元，投资者信心仍存。新突破来自Q*技术与推理模型o3，但聊天场景适配问题仍未解决。OpenAI正开发“通用验证器”优化强化学习，CEO称GPT-5能力远超人类。下周发布在即，期待值拉满。

原文链接

代码编织者

08-02 17:22:34

分享至

打开微信扫一扫

内容投诉

生成图片

阿里通义千问推出全新推理模型 Qwen3-30B-A3B-Thinking-2507，多项能力显著提升

7月31日，阿里通义千问发布全新推理模型Qwen3-30B-A3B-Thinking-2507，多项能力显著提升。新模型在数学能力评测AIME25中获85.0高分，代码能力测试LiveCodeBench v6得分66.0，超越Gemini2.5-Flash和Qwen3-235B-A22B。其知识水平、写作、Agent能力、多轮对话及多语言指令遵循等通用能力均表现优异。上下文长度原生支持256K tokens，可扩展至1M tokens，思考长度也增加，适合复杂推理任务。该模型已开源，可在魔搭社区、HuggingFace获取，并支持消费级硬件本地部署，同时上线Qwen Chat平台。

原文链接

智能维度跳跃

07-31 07:59:58

分享至

打开微信扫一扫

内容投诉

生成图片

什么是真正好用的推理模型？阶跃Step 3：开源的，多模态的，低成本的，国产芯片适配的

2025年7月，阶跃星辰在WAIC发布新一代基础大模型Step 3，参数达321B，具备多模态推理能力，并计划于7月31日正式开源。该模型在MMMU等多模态榜单中取得开源模型新SOTA成绩，推理解码成本仅为DeepSeek的1/3，国产芯片适配效率最高可达其300%。Step 3通过系统协同设计优化解码效率，创新包括AFD分布式推理系统和MFA注意力机制，显著降低硬件成本与延迟。同时，阶跃联合华为昇腾等近10家厂商发起“模芯生态创新联盟”，推动软硬件协同发展。终端应用方面，Step 3已落地智能座舱、手机及IoT设备，预计2025年全年收入冲刺10亿人民币，成为AI产业务实性选项的代表。

原文链接

AI奇点纪元

07-28 10:09:36

分享至

打开微信扫一扫

内容投诉

生成图片

性能比肩 Gemini-2.5 pro、o4-mini：阿里通义千问 Qwen 3 推理模型超级进化，现已开源

7月25日，阿里通义千问发布Qwen3-235B-A22B-Thinking-2507模型升级版。该模型在推理性能和通用能力上均有显著提升，号称比肩Gemini-2.5 pro、O4-mini等顶尖闭源模型，并创下开源模型SOTA最佳表现。其核心能力覆盖编程（LiveCodeBench）、数学（AIME25）、知识问答（SuperGPQA）、创意写作（WritingBench）、多语言支持（MultilF）等领域，同时支持256K长文本理解。新模型已通过魔搭社区和Hugging Face开源，采用Apache2.0协议，可免费下载商用。

原文链接