
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
标题:3nm赛道挤满ASIC芯片
博通2025财年第一季度营收149.16亿美元,同比增长25%,AI相关收入达41亿美元。Marvell预计第一财季销售额18.8亿美元,AI业务收入约7亿美元。大模型迭代加速,DeepSeek推出NSA算法,马斯克发布Grok 3模型。AI转向推理阶段,定制化...
原文链接
中国联通宣布对DeepSeek系列模型进行了“自适应慢思考”优化升级,平均节省30%推理计算量。该模型具备多学科、多场景通用推理能力,能自适应不同任务和难度,避免资源浪费。通过难度自适应微调、二次蒸馏及难度自适应强化学习等技术,优化后的模型在不同难度问题上生成的回答长度明显下降,用户体验提升。此次优化是业界首次对DeepSeek系列思维链模型进行此类升级,现已开源。
原文链接
标题:OpenAI附议Ilya预训练终结!“但Scaling Law还没死”
在Ilya提出“预训练即将终结”的观点后,“Scaling Law”成为热议话题。在最近的NeurIPS会议上,OpenAI的大神Noam Brown表示,o1代表一种新的以推理计算为特点的Scaling方法。
Noam ...
原文链接
加载更多

暂无内容