综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2025年12月,英伟达以200亿美元收购AI芯片公司Groq,旨在应对谷歌TPU等新竞争者对其GPU主导地位的威胁。此次收购被视作英伟达补强推理能力的关键举措,因推理市场对低延迟需求远超GPU现有能力。Groq的LPU芯片采用片上SRAM技术,在decode阶段速度远超GPU和TPU,但内存容量有限,需大量芯片协同工作。业内人士指出,推理芯片市场竞争激烈,利润较低,但用户对速度的需求正快速增长。英伟达此举意在通过‘混搭’策略巩固其AI领域霸主地位,同时抵御新兴对手冲击。
原文链接
OpenAI近日发布了o3-pro,号称最强推理AI模型,其推理能力显著提升。同时,OpenAI宣布o3的价格下调80%,使输入和输出token的成本分别降至2美元和8美元每百万,相比调整前大幅降低。这一价格已接近GPT-4o的水平,对开发者更具吸引力。o3-pro具备200k的上下文窗口和100k的最大输出token数,可支持约15万字的提示词输入,极大增强了RAG(检索增强生成)的能力。专家表示,更强的上下文支持和更低的成本将推动RAG技术在复杂应用场景中的进一步发展,包括医疗诊断、知识图谱构建及推理型任务等。尽管如此,模型对长文的理解仍有限,未来可能需要结合更多智能化策略优化性能。
原文链接
标题:蚂蚁武威:下一代「推理」模型范式大猜想
正文:
R1 后,长思维链成为下一代基础模型推理能力研究的热门方向。R1 表明大模型深度思考可行,但推理序幕才刚开启。R1 还影响了国内研究,激励更多人提出前瞻技术思想,蚂蚁技术研究院武威是典型代表。
武威本科和博士毕业于北大数学科学学院,曾获微...
原文链接
美国AI芯片独角兽SambaNova Systems近日宣布裁员77人,占员工总数约15%,以应对市场变化并聚焦AI推理业务。SambaNova成立于2017年,总部位于加州,曾计划开发统一架构的AI训练与推理芯片,但在最新一轮调整中转向专注AI推理。上一轮D轮融资使公司估值超50亿美元。SambaNova发言人表示,此次调整旨在适应从训练到推理的市场趋势,同时加速云优先解决方案布局。目前,AI推理芯片需求旺盛,SambaNova目标客户为企业市场,去年9月推出了SambaNova Cloud服务。其第四代处理器SN40L凭借数据流架构和三层内存架构,在AI推理效率上表现优异,测试显示其性能较GPU驱动系统快10倍以上。然而,面对英伟达的市场主导地位,SambaNova仍需应对激烈竞争。
原文链接
4月30日,小米开源首个“为推理而生”的大模型Xiaomi MiMo。该模型由小米大模型Core团队开发,仅用7B参数规模,在数学推理(AIME 24-25)和代码竞赛(LiveCodeBench v5)中超越了OpenAI的o1-mini及阿里Qwen的QwQ-32B-Preview。MiMo的推理能力提升得益于预训练和后训练阶段的数据与算法创新。预训练阶段通过挖掘富推理语料合成200B tokens数据,并进行三阶段训练,总计25T tokens;后训练阶段采用Test Difficulty Driven Reward算法缓解奖励稀疏问题,引入Easy Data Re-Sampling策略稳定RL训练,同时设计Seamless Rollout系统加速RL和验证过程。MiMo已在Hugging Face和GitHub上开源,技术报告同步发布。
原文链接
三大模型巨头比拼“幻觉”能力:ChatGPT优势明显,DeepSeek表现欠佳
近日,智利大学研究员Roberto Araya通过四组对照实验,比较了Gemini 2.0 Flash、ChatGPT o3-mini和DeepSeek R1在应对幻觉问题上的表现。实验结果显示,ChatGPT o3...
原文链接
3月20日,英伟达发布Llama Nemotron系列开放推理AI模型,支持智能体AI系统,能独立推理、规划和执行多步骤任务,适用于机器人、自动化及决策优化场景,大幅降低推理成本,推动企业AI自主化升级。该系列包括Nano、Super和Ultra三种规模,分别针对PC/边缘设备、单GPU部署和多GPU服务器优化。同时,英伟达推出Cosmos Nemotron新成员,专注于视觉语言模型(VLM),可解析图像、视频及传感器数据,扩展其Cosmos WFM平台能力,广泛应用于自动驾驶和工业机器人等多模态推理领域。
原文链接
标题:老黄发布新核弹B300,英伟达刷新推理性能纪录
皮衣“老黄”携最强AI芯片GB300亮相“AI超级碗”GTC,燃爆全场。与去年的GB200相比,GB300的推理性能提升了1.5倍,预计下半年出货。此外,老黄还预览了下一代AI超级芯片Vera Rubin,将于2026年下半年发货,其性能更是...
原文链接
标题:中科院自动化所推出多图数学推理新基准MV-MATH
挑战多图数学推理新基准,大模型表现不佳?
近日,中国科学院自动化研究所推出多图数学推理数据集MV-MATH,旨在全面评估多模态大语言模型在多视觉场景中的数学推理能力。
结果显示,GPT-4o得分为32.1,类o1模型QvQ得分29.3,所有模...
原文链接
英伟达发布新款人工智能芯片Blackwell,体积更大、内存更大,专为推理任务优化。尽管竞争对手AMD等公司虎视眈眈,英伟达依然保持领先地位。最新财报显示,英伟达销售额和利润超出预期,但股价因利润率收窄及对中国芯片销售的担忧而下跌8.5%。黄仁勋表示,推理模型需要百倍计算能力,Blackwell芯片已在多家公司部署。尽管如此,初创公司如Etched和Cerebras也在竞争中崭露头角,挑战Nvidia的地位。
原文链接
加载更多
暂无内容