
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
9月22日,美团LongCat团队发布全新高效推理模型LongCat-Flash-Thinking,综合性能达全球开源模型最先进水平(SOTA)。该模型在逻辑、数学、代码及智能体任务中表现卓越,是国内首个结合“深度思考+工具调用”与“非形式化+形式化”推理能力的语言模型。通过创新架构如领域并行强化学习和异步弹性共卡系统,模型实现高效推理与稳定训练,在复杂任务中显著优化资源利用。多项权威评测显示,其在ARC-AGI、HMMT、LiveCodeBench等基准测试中刷新纪录,超越OpenAI o3、Gemini2.5 Pro等顶尖模型。项目已开源,地址包括Hugging Face与Github。
原文链接
9月22日,美团LongCat团队发布全新高效推理模型LongCat-Flash-Thinking。该模型融合了「深度思考+工具调用」与「非形式化+形式化」推理能力,能够更高效地完成复杂任务。目前,模型已在HuggingFace和Github全面开源,供开发者自由使用。这一发布为AI推理领域提供了新工具,引发广泛关注。
原文链接
9月22日,马斯克旗下xAI宣布推出Grok 4 Fast,这是一款更快、更高效的推理模型。相比Grok 4,Grok 4 Fast在性能相似的情况下,平均使用的思考Token减少了40%,计算速度更快且价格降低了98%。此外,该模型在前沿基准测试中表现出与Grok 4相同的性能水平。这一发布标志着xAI在优化AI模型效率和降低成本方面取得重要进展,为用户带来更高效、经济的解决方案。
原文链接
9月21日,马斯克旗下xAI公司发布新型多模态推理模型Grok-4 Fast,性能媲美行业领先水平。该模型支持高达2M上下文窗口,具备强大的复杂任务处理能力,并与X平台深度集成,可解析帖子、提供链接及关联YouTube视频。其采用强化学习训练,能自主调用外部工具,搭载智能搜索引擎,实时浏览网页和X平台内容,整合多模态信息并输出分析结果。目前,Grok-4 Fast已向所有用户开放,并在Auto模式下自动处理复杂查询。此外,xAI还推出grok-4-fast-reasoning和grok-4-fast-non-reasoning两款新模型,现已通过API开放使用。
原文链接
9月9日,阿联酋穆罕默德·本·扎耶德人工智能大学与G42联合发布低成本AI推理模型“K2 Think”。该模型基于阿里巴巴开源Qwen 2.5构建,仅需320亿参数,性能却超越规模大20倍的模型,宣称性价比超同行20倍。通过长链式思维监督微调和推理阶段扩展等技术,“K2 Think”在数学、科学等特定领域表现出色。这一成果展示了阿联酋在AI领域的创新能力,同时凸显开源技术对全球AI发展的推动作用。
原文链接
当地时间9月9日,阿联酋穆罕默德·本·扎耶德人工智能大学(MBZUAI)与G42联合发布低成本推理模型“K2 Think”。该模型仅需320亿参数,性能却超越规模大20倍的同类模型,基于阿里巴巴开源Qwen 2.5构建,并在Cerebras硬件上运行。团队采用长链式思维监督微调和推理阶段扩展等技术,将其作为系统部署并持续优化。MBZUAI称,K2 Think不仅是技术突破,更是阿联酋AI领域的重要里程碑。阿联酋正努力成为全球AI领导者,以减少对原油依赖。尽管面临中美领先竞争,K2 Think专注于数学、科学等特定领域应用,旨在用更少资源实现高效推理,惠及缺乏资本的地区。
原文链接
8月11日,智谱AI发布全球100B级效果最佳的开源视觉推理模型GLM-4.5V(总参数106B,激活参数12B),并在魔搭社区与Hugging Face同步开源。该模型基于GLM-4.5-Air,综合性能在41个视觉多模态榜单中达同级别SOTA水平,涵盖图像、视频、文档理解等任务。新增“思考模式”开关,可灵活选择快速响应或深度推理,并支持全场景视觉推理,如复杂图表分析、长视频分镜处理等。同时,智谱AI开源一款桌面助手应用,可实时截屏、录屏并依托GLM-4.5V完成代码辅助、文档解读等任务,旨在赋能开发者打造多模态应用场景,将科幻变为现实。API调用价格低至输入2元/M tokens,输出6元/M tokens。
原文链接
百度计划于2025年8月底前发布一款新的AI推理模型,该模型可处理更复杂任务,以应对与DeepSeek和OpenAI等公司的竞争。此外,百度还将在未来几个月推出其核心基础模型的更新版本——文心5.0(Ernie 5.0)。今年3月,百度已发布了文心大模型4.5和X1,其中4.5在多模态理解和逻辑推理等方面表现优于GPT4.5,而X1则对标DeepSeek-R1,具备多模态与多工具调用能力。新模型的发布将进一步巩固百度在AI领域的竞争力。
原文链接
标题:揭秘:OpenAI如何发展推理模型?
正文:
ChatGPT的爆火看似偶然,但背后却是OpenAI多年深思熟虑的结果。科技媒体Techcrunch的深度文章揭示了OpenAI从数学竞赛到“通用AI智能体”的宏大愿景,其核心是对AI“推理”能力的终极探索。
意外的起点是数学。2022年,...
原文链接
2025年8月初,外媒曝光GPT-5开发内幕:核心团队被小扎挖角致内部混乱,推理模型技术瓶颈让项目一度停滞。Orion模型因性能不佳降级为GPT-4.5,且GPT-5未达GPT-3到GPT-4级别的跃迁。尽管如此,OpenAI获83亿美元融资,估值达3000亿美元,投资者信心仍存。新突破来自Q*技术与推理模型o3,但聊天场景适配问题仍未解决。OpenAI正开发“通用验证器”优化强化学习,CEO称GPT-5能力远超人类。下周发布在即,期待值拉满。
原文链接
加载更多

暂无内容