
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
正文:2025年8月,国外学者P.V. Coveney和S. Succi发表研究警告称,大语言模型(LLM)依赖的Scaling Law在提升预测不确定性方面存在严重缺陷,可能导致‘退化式AI’风险。他们指出,LLM通过暴力数据扩展追求性能提升可能积累错误与不准确性,根本原因在于非高斯波动引发的信息灾难。研究强调,当前极低的扩展指数表明行业已进入收益递减阶段,继续盲目扩张算力将加剧问题。为避免退化式AI,研究团队呼吁回归科学方法,利用物理规律和问题导向的小规模网络替代粗暴扩展路径。
原文链接
7月28日,华泰证券发布研报称,随着海外互联网大厂Token放量加速,市场对AI推理算力需求的预期逐步消化,但全球算力需求仍存在较大预期差。伴随大型算力集群落地、模型新架构探索以及Scaling Law的推进,未来训练端算力需求增长空间可观。华泰证券长期看好AI算力需求的持续增长,认为行业前景广阔。
原文链接
CVPR 2025期间,小鹏汽车在自动驾驶分论坛发表主题演讲,首次验证了Scaling Law在自动驾驶领域的有效性。小鹏展示了基于云端超大规模多模态模型(VLA)的自动驾驶基座模型,参数量高达720亿,部署在云端并通过知识蒸馏部署到车端。该模型通过强化学习提升安全、效率和合规性,在极端复杂场景中表现丝滑,如绕行大车、应对狭窄道路等。小鹏的VLM(视觉语言模型)和VLA-OL模型不仅提升了智能辅助驾驶能力,还实现了车端的持续在线学习,为下一代自动驾驶设定了新标准。小鹏的新方案与传统L2和L4路线不同,强调云端大模型与车端小模型协同,有望推动自动驾驶技术的突破性进展。
原文链接
标题:千寻智能解浚源:具身智能的Scaling Law已跨过起跑线丨具身先锋十人谈
正文:
作者 | 赖文昕
编辑 | 陈彩娴
不久前,北京亦庄举办的“人形机器人半程马拉松”为具身智能行业再添热度。20支参赛队伍中,仅6支完赛,完赛率30%,质疑声随之而来:具身智能是不是泡沫?
对此,千寻智...
原文链接
标题:ICLR 2025:顶尖科学家热议AI趋势
自GPT-4发布以来,大语言模型的研究热度不减,技术进步不断涌现。Anthropic于2024年11月发布的MCP成为AI生态的重要桥梁,而GPT-4o和GPT-4.1的相继推出,则将上下文处理能力提升了八倍。在国内,DeepSeek凭借FP8混...
原文链接
标题:推荐场景Scaling Law来了!中科大&华为诺亚方舟联合推出
当Scaling Law应用于推荐场景,模型又将如何表现?中科大认知智能全国重点实验室陈恩红团队联合华为诺亚方舟实验室推出了“推荐模型性能定律”,首次对模型性能与模型、数据的规模和质量进行了定量分析。
论文首次尝试对...
原文链接
苹果发现模型蒸馏Scaling Law!教师模型并非越强越好
克雷西 发自 凹非寺 | 量子位 | 公众号 QbitAI
苹果最新研究揭示了大模型蒸馏的Scaling Law,即学生模型和教师模型能力间的幂律关系。研究发现,教师模型并非越强越好,过强的教师模型可能导致学生模型性能恶化。
研究显示,学...
原文链接
标题:现在的大模型现状,就是豪赌
现在的大模型现状可以用一个词总结——豪赌。若能成功,未来前景广阔。
2023年,大模型强调Scaling Law;2024年,该理论面临挑战。2025年起,传统路径难以持续,需探索新方向。这条路充满不确定性和高成本,但潜力巨大。
去年我们假设有一条清晰的Scalin...
原文链接
百度被曝最早发现大模型核心理论Scaling Law,该理论认为训练数据和模型参数越大,模型智能能力越强。百度在2014年即有研究发现,早于OpenAI的2020年论文。百度招揽了多位AI大牛,如Dario Amodei和吴恩达,为其领先发现Scaling Law奠定了基础。百度早在2019年就发布了第一代文心大模型,目前文心一言已成为国内使用率最高的生成式AI平台。中国AI产业整体水平与海外相当,百度、阿里、腾讯等公司在技术创新、产品创新和应用创新方面均表现出色。
原文链接
标题:智源王仲远:多模态大模型对产业更加重要,得多模态大模型得天下
大模型的出现成为AI第三次浪潮的新拐点。北京智源人工智能研究院院长王仲远表示,模型参数、训练数据及计算能力的提升带来模型效果的巨大进步,即Scaling Law在人工智能发展中一直起作用。
智源在过去六年建立了国内最早的大模型研发团队,并自2020年10月起持续推动大模型技术。未来,多模态数据如图像、音频、视频将激发大模型的智能,原生统一的多模态大模型能更好支撑产业应用。
王仲远认为,明年将出现更多基于大模型的应用。智源研究院已发布悟道1.0至3.0系列,并孵化多家大模型公司。当前大模型仍面临幻觉问题,但智源的通用向量模型已在多个平台上广泛应用。
智源还致力于视觉和多模态研究,发布了Emu3,将视觉信号和文本统一训练,实现图像和视频的生成与理解。未来,智源将研发具身大模型,融合多模态技术和硬件,以实现更广泛的工业应用。
原文链接
加载更多

暂无内容