推理 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

DeepSeek秘密造芯！专攻推理，一年前已启动，招聘全程不公开

据路透社7月7日消息，中国AI公司DeepSeek正秘密研发自研AI推理芯片，旨在降低对英伟达的依赖。该项目约一年前启动，现处早期阶段，已与多家设计及代工厂接洽，工程师招聘全程保密。随着AI算力需求向推理倾斜，自研芯片可大幅降低成本，DeepSeek也已在算法层面为硬件协同做好铺垫。支撑此战略的是其今年6月完成的约510亿元首轮融资，资金将用于芯片自研、扩建国产算力中心及扩充人才。目前，公司正同步推进内蒙古乌兰察布等地的数据中心建设，加速向软硬一体的AI巨头转型。

原文链接

智能视野

07-08 13:08:19

分享至

打开微信扫一扫

内容投诉

生成图片

Meta亿元天团首个大模型交卷！余家辉宋飏Jason Wei耗时九个月，一雪Llama前耻

2026年4月，Meta推出首个由‘亿元天团’打造的大模型Muse Spark，主打多模态能力。这款模型由亚历山大王带队，余家辉、宋飏、Jason Wei等顶尖专家耗时9个月完成，旨在弥补Llama系列的不足。发布后，Meta股价一度上涨10%，市场反响热烈。Muse Spark在多模态理解、推理及医学领域表现出色，但在编程和长时间自主任务上仍有差距。Meta此次采取闭源策略，仅向部分合作伙伴开放API，但计划未来开源后续版本。此外，模型新增‘沉思模式’以提升复杂推理能力，并上线个性化购物推荐功能。第三方测评显示，Muse Spark已重回人工智能第一梯队，仅次于Gemini 3.1 Pro、GPT-5.4等顶级模型。然而，部分用户反馈其在编程任务中表现不佳，存在翻车案例。

原文链接

WisdomTrail

04-09 09:56:45

分享至

打开微信扫一扫

内容投诉

生成图片

老黄200亿「钞能力」回应谷歌：联手Groq，补上推理短板

2025年12月，英伟达以200亿美元收购AI芯片公司Groq，旨在应对谷歌TPU等新竞争者对其GPU主导地位的威胁。此次收购被视作英伟达补强推理能力的关键举措，因推理市场对低延迟需求远超GPU现有能力。Groq的LPU芯片采用片上SRAM技术，在decode阶段速度远超GPU和TPU，但内存容量有限，需大量芯片协同工作。业内人士指出，推理芯片市场竞争激烈，利润较低，但用户对速度的需求正快速增长。英伟达此举意在通过‘混搭’策略巩固其AI领域霸主地位，同时抵御新兴对手冲击。

原文链接

元界筑梦师

12-28 22:46:20

分享至

打开微信扫一扫

内容投诉

生成图片

OpenAI o3-pro发布，也许当前的RAG过时了

OpenAI近日发布了o3-pro，号称最强推理AI模型，其推理能力显著提升。同时，OpenAI宣布o3的价格下调80%，使输入和输出token的成本分别降至2美元和8美元每百万，相比调整前大幅降低。这一价格已接近GPT-4o的水平，对开发者更具吸引力。o3-pro具备200k的上下文窗口和100k的最大输出token数，可支持约15万字的提示词输入，极大增强了RAG（检索增强生成）的能力。专家表示，更强的上下文支持和更低的成本将推动RAG技术在复杂应用场景中的进一步发展，包括医疗诊断、知识图谱构建及推理型任务等。尽管如此，模型对长文的理解仍有限，未来可能需要结合更多智能化策略优化性能。

原文链接

镜像现实MirageX

06-17 18:31:23

分享至

打开微信扫一扫

内容投诉

生成图片

蚂蚁武威：下一代「推理」模型范式大猜想

标题：蚂蚁武威：下一代「推理」模型范式大猜想正文： R1 后，长思维链成为下一代基础模型推理能力研究的热门方向。R1 表明大模型深度思考可行，但推理序幕才刚开启。R1 还影响了国内研究，激励更多人提出前瞻技术思想，蚂蚁技术研究院武威是典型代表。武威本科和博士毕业于北大数学科学学院，曾获微...

原文链接

LunarCoder

05-21 00:47:21

分享至

打开微信扫一扫

内容投诉

生成图片

360亿AI芯片独角兽，裁员15%

美国AI芯片独角兽SambaNova Systems近日宣布裁员77人，占员工总数约15%，以应对市场变化并聚焦AI推理业务。SambaNova成立于2017年，总部位于加州，曾计划开发统一架构的AI训练与推理芯片，但在最新一轮调整中转向专注AI推理。上一轮D轮融资使公司估值超50亿美元。SambaNova发言人表示，此次调整旨在适应从训练到推理的市场趋势，同时加速云优先解决方案布局。目前，AI推理芯片需求旺盛，SambaNova目标客户为企业市场，去年9月推出了SambaNova Cloud服务。其第四代处理器SN40L凭借数据流架构和三层内存架构，在AI推理效率上表现优异，测试显示其性能较GPU驱动系统快10倍以上。然而，面对英伟达的市场主导地位，SambaNova仍需应对激烈竞争。

原文链接

智慧棱镜

05-09 19:56:29

分享至

打开微信扫一扫

内容投诉

生成图片

小米开源“Xiaomi MiMo”大模型：为推理而生，以 7B 参数超越 OpenAI o1-mini

4月30日，小米开源首个“为推理而生”的大模型Xiaomi MiMo。该模型由小米大模型Core团队开发，仅用7B参数规模，在数学推理(AIME 24-25)和代码竞赛(LiveCodeBench v5)中超越了OpenAI的o1-mini及阿里Qwen的QwQ-32B-Preview。MiMo的推理能力提升得益于预训练和后训练阶段的数据与算法创新。预训练阶段通过挖掘富推理语料合成200B tokens数据，并进行三阶段训练，总计25T tokens；后训练阶段采用Test Difficulty Driven Reward算法缓解奖励稀疏问题，引入Easy Data Re-Sampling策略稳定RL训练，同时设计Seamless Rollout系统加速RL和验证过程。MiMo已在Hugging Face和GitHub上开源，技术报告同步发布。

原文链接

AI创想团

04-30 19:37:14

分享至

打开微信扫一扫

内容投诉

生成图片

三大模型巨头比拼思考“幻觉”：DeepSeek 不敌 ChatGPT，Gemini 用词最少

三大模型巨头比拼“幻觉”能力：ChatGPT优势明显，DeepSeek表现欠佳近日，智利大学研究员Roberto Araya通过四组对照实验，比较了Gemini 2.0 Flash、ChatGPT o3-mini和DeepSeek R1在应对幻觉问题上的表现。实验结果显示，ChatGPT o3...

原文链接

Nebula

03-28 15:55:43

分享至

打开微信扫一扫

内容投诉

生成图片

英伟达发布 Llama Nemotron 系列开放推理 AI 模型及 Cosmos Nemotron 新成员

3月20日，英伟达发布Llama Nemotron系列开放推理AI模型，支持智能体AI系统，能独立推理、规划和执行多步骤任务，适用于机器人、自动化及决策优化场景，大幅降低推理成本，推动企业AI自主化升级。该系列包括Nano、Super和Ultra三种规模，分别针对PC/边缘设备、单GPU部署和多GPU服务器优化。同时，英伟达推出Cosmos Nemotron新成员，专注于视觉语言模型（VLM），可解析图像、视频及传感器数据，扩展其Cosmos WFM平台能力，广泛应用于自动驾驶和工业机器人等多模态推理领域。

原文链接

E-Poet

03-20 11:22:58

分享至

打开微信扫一扫

内容投诉

生成图片

老黄发布新核弹B300，英伟达：B200已破DeepSeek-R1推理世界纪录

标题：老黄发布新核弹B300，英伟达刷新推理性能纪录皮衣“老黄”携最强AI芯片GB300亮相“AI超级碗”GTC，燃爆全场。与去年的GB200相比，GB300的推理性能提升了1.5倍，预计下半年出货。此外，老黄还预览了下一代AI超级芯片Vera Rubin，将于2026年下半年发货，其性能更是...

原文链接