标题:面壁者决心“破壁”
近日,面壁智能首席科学家刘知远在2024中国人工智能大会上表示,大模型不应局限于少数几个,未来将如CPU般普及。他强调降低成本的重要性,使每个人都能拥有大模型,改善生活、学习和工作。
刘知远指出,当前数据接近耗尽,模型训练面临瓶颈,但他认为通过强化学习或合成数据仍可突破。一年前,他就预见了这一问题,认为国内很快会有五六家达到GPT-4水平的模型,商业竞争激烈。因此,面壁智能专注于端侧模型,降低成本并提高性能。
刘知远还提出了大模型密度定律(Densing Law),即模型能力密度随时间呈指数级增长。这类似于摩尔定律,意味着更少参数也能实现相同效果,从而拓宽应用场景。
面对llya关于预训练终结的观点,刘知远认为数据和算力都是关键问题,解决方案需进一步探讨。国内已有公司放弃预训练,他认为这是理性选择。未来,端侧模型的发展趋势将越来越明显。
刘知远强调,降低训练成本和提升模型品质是关键。面对不确定性,他建议寻找历史规律,不断适应新技术的发展。
原文链接
本文链接:https://kx.umi6.com/article/10564.html
转载请注明文章出处
相关推荐
换一换
DeepSeek新大招曝光:下一步智能体
2025-09-05 10:15:28
上海:推动医疗器械相关垂类大模型研发应用
2025-09-15 16:02:14
ToC智能体火得快,但更大的价值在企业丨中关村科金@MEET2026
2025-12-12 14:53:17
腾讯升级大模型研发架构 前OpenAI顶尖研究员出任首席AI科学家
2025-12-17 18:59:08
豆包大模型2.0正式发布
2026-02-14 14:23:01
1300000000000000!谷歌每月Tokens消耗量曝光(别数了是千万亿)
2025-10-11 09:26:13
百度新设两个大模型研发部:直接向CEO李彦宏汇报!
2025-11-25 22:10:22
中国中文信息学会2025学术年会暨第二届中国大模型大会(CIPS & CLM 2025)于10月28日在北京盛大开幕
2025-10-30 18:52:50
中金:2026年大模型在强化学习、模型记忆、上下文工程等方面将取得更多突破
2026-02-05 08:39:59
腾讯AI下了一场「及时雨」
2025-12-19 10:42:16
大模型产生幻觉,全怪人类PUA吗?
2025-09-10 15:36:03
顶尖技术+标准产品+创新模式+可靠服务,打造大模型商业落地中国范式
2025-12-16 10:32:22
杭州“十五五”规划建议:实施大模型前沿技术攻关和高端芯片、基础软件、模型算法等研发计划 建设人工智能开源社区
2026-01-16 11:34:57
688 文章
486166 浏览
24小时热文
更多
-
2026-03-09 21:13:27 -
2026-03-09 20:09:26 -
2026-03-09 20:09:18