综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
林俊旸离职后首次发声:复盘千问弯路,展望AI新方向
林俊旸在离职阿里千问后首次公开发声,未谈及离职细节或未来去向,而是聚焦于技术反思与AI未来。他坦言千问团队“没有全做对”,并指出过去两年推理模型时代的使命已完成,下一步应转向“智能体式思维”(Agentic Thinking)。
千问团队曾尝试将“...
原文链接
2026年1月6日,OpenAI研究副总裁Jerry Tworek宣布离职,他曾是GPT-4、o1推理模型及Codex等关键项目的核心贡献者。Jerry在OpenAI工作近七年,主导了多项突破性研究,包括大语言模型的推理能力开发和首个AI编程模型Codex。他表示,离职是为了探索在OpenAI难以开展的研究领域,并回顾了在公司经历的美好与疯狂时刻。他的离职引发广泛讨论,网友纷纷表达感谢与赞叹,也有部分人对OpenAI重要人才流失表示遗憾。Jerry的职业生涯始于数学与量化研究,后转向强化学习与AI研究,其贡献深刻影响了AI技术发展。
原文链接
9月22日,美团LongCat团队发布全新高效推理模型LongCat-Flash-Thinking,综合性能达全球开源模型最先进水平(SOTA)。该模型在逻辑、数学、代码及智能体任务中表现卓越,是国内首个结合“深度思考+工具调用”与“非形式化+形式化”推理能力的语言模型。通过创新架构如领域并行强化学习和异步弹性共卡系统,模型实现高效推理与稳定训练,在复杂任务中显著优化资源利用。多项权威评测显示,其在ARC-AGI、HMMT、LiveCodeBench等基准测试中刷新纪录,超越OpenAI o3、Gemini2.5 Pro等顶尖模型。项目已开源,地址包括Hugging Face与Github。
原文链接
9月22日,马斯克旗下xAI宣布推出Grok 4 Fast,这是一款更快、更高效的推理模型。相比Grok 4,Grok 4 Fast在性能相似的情况下,平均使用的思考Token减少了40%,计算速度更快且价格降低了98%。此外,该模型在前沿基准测试中表现出与Grok 4相同的性能水平。这一发布标志着xAI在优化AI模型效率和降低成本方面取得重要进展,为用户带来更高效、经济的解决方案。
原文链接
标题:揭秘:OpenAI如何发展推理模型?
正文:
ChatGPT的爆火看似偶然,但背后却是OpenAI多年深思熟虑的结果。科技媒体Techcrunch的深度文章揭示了OpenAI从数学竞赛到“通用AI智能体”的宏大愿景,其核心是对AI“推理”能力的终极探索。
意外的起点是数学。2022年,...
原文链接
2025年8月初,外媒曝光GPT-5开发内幕:核心团队被小扎挖角致内部混乱,推理模型技术瓶颈让项目一度停滞。Orion模型因性能不佳降级为GPT-4.5,且GPT-5未达GPT-3到GPT-4级别的跃迁。尽管如此,OpenAI获83亿美元融资,估值达3000亿美元,投资者信心仍存。新突破来自Q*技术与推理模型o3,但聊天场景适配问题仍未解决。OpenAI正开发“通用验证器”优化强化学习,CEO称GPT-5能力远超人类。下周发布在即,期待值拉满。
原文链接
7月31日,阿里通义千问发布全新推理模型Qwen3-30B-A3B-Thinking-2507,多项能力显著提升。新模型在数学能力评测AIME25中获85.0高分,代码能力测试LiveCodeBench v6得分66.0,超越Gemini2.5-Flash和Qwen3-235B-A22B。其知识水平、写作、Agent能力、多轮对话及多语言指令遵循等通用能力均表现优异。上下文长度原生支持256K tokens,可扩展至1M tokens,思考长度也增加,适合复杂推理任务。该模型已开源,可在魔搭社区、HuggingFace获取,并支持消费级硬件本地部署,同时上线Qwen Chat平台。
原文链接
2025年7月,阶跃星辰在WAIC发布新一代基础大模型Step 3,参数达321B,具备多模态推理能力,并计划于7月31日正式开源。该模型在MMMU等多模态榜单中取得开源模型新SOTA成绩,推理解码成本仅为DeepSeek的1/3,国产芯片适配效率最高可达其300%。Step 3通过系统协同设计优化解码效率,创新包括AFD分布式推理系统和MFA注意力机制,显著降低硬件成本与延迟。同时,阶跃联合华为昇腾等近10家厂商发起“模芯生态创新联盟”,推动软硬件协同发展。终端应用方面,Step 3已落地智能座舱、手机及IoT设备,预计2025年全年收入冲刺10亿人民币,成为AI产业务实性选项的代表。
原文链接
7月25日,阿里通义千问发布Qwen3-235B-A22B-Thinking-2507模型升级版。该模型在推理性能和通用能力上均有显著提升,号称比肩Gemini-2.5 pro、O4-mini等顶尖闭源模型,并创下开源模型SOTA最佳表现。其核心能力覆盖编程(LiveCodeBench)、数学(AIME25)、知识问答(SuperGPQA)、创意写作(WritingBench)、多语言支持(MultilF)等领域,同时支持256K长文本理解。新模型已通过魔搭社区和Hugging Face开源,采用Apache2.0协议,可免费下载商用。
原文链接
7月25日,阿里巴巴在《科创板日报》宣布开源全新千问3推理模型,性能显著提升,成为全球最强开源模型,媲美顶级闭源模型Gemini-2.5 pro和o4-mini。本周,阿里已连续开源三款重磅模型,分别在基础模型、编程模型和推理模型三大主流领域夺得全球开源冠军,进一步巩固其在人工智能领域的领先地位。
原文链接
加载更多
暂无内容