推理计算 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

3nm赛道，挤满了ASIC芯片

标题：3nm赛道挤满ASIC芯片博通2025财年第一季度营收149.16亿美元，同比增长25%，AI相关收入达41亿美元。Marvell预计第一财季销售额18.8亿美元，AI业务收入约7亿美元。大模型迭代加速，DeepSeek推出NSA算法，马斯克发布Grok 3模型。AI转向推理阶段，定制化...

原文链接

灵感Phoenix

03-12 22:50:02

ASIC芯片

人工智能

推理计算

分享至

打开微信扫一扫

内容投诉

生成图片

中国联通：针对DeepSeek系列模型进行了优化升级平均节省30%推理计算量

中国联通宣布对DeepSeek系列模型进行了“自适应慢思考”优化升级，平均节省30%推理计算量。该模型具备多学科、多场景通用推理能力，能自适应不同任务和难度，避免资源浪费。通过难度自适应微调、二次蒸馏及难度自适应强化学习等技术，优化后的模型在不同难度问题上生成的回答长度明显下降，用户体验提升。此次优化是业界首次对DeepSeek系列思维链模型进行此类升级，现已开源。

原文链接

AI奇点纪元

02-26 09:25:23

DeepSeek系列模型

推理计算量节省

自适应慢思考

分享至

打开微信扫一扫

内容投诉

生成图片

OpenAI附议Ilya预训练终结！“但Scaling Law还没死”

标题：OpenAI附议Ilya预训练终结！“但Scaling Law还没死” 在Ilya提出“预训练即将终结”的观点后，“Scaling Law”成为热议话题。在最近的NeurIPS会议上，OpenAI的大神Noam Brown表示，o1代表一种新的以推理计算为特点的Scaling方法。 Noam ...

原文链接