标题:面壁者决心“破壁”
近日,面壁智能首席科学家刘知远在2024中国人工智能大会上表示,大模型不应局限于少数几个,未来将如CPU般普及。他强调降低成本的重要性,使每个人都能拥有大模型,改善生活、学习和工作。
刘知远指出,当前数据接近耗尽,模型训练面临瓶颈,但他认为通过强化学习或合成数据仍可突破。一年前,他就预见了这一问题,认为国内很快会有五六家达到GPT-4水平的模型,商业竞争激烈。因此,面壁智能专注于端侧模型,降低成本并提高性能。
刘知远还提出了大模型密度定律(Densing Law),即模型能力密度随时间呈指数级增长。这类似于摩尔定律,意味着更少参数也能实现相同效果,从而拓宽应用场景。
面对llya关于预训练终结的观点,刘知远认为数据和算力都是关键问题,解决方案需进一步探讨。国内已有公司放弃预训练,他认为这是理性选择。未来,端侧模型的发展趋势将越来越明显。
刘知远强调,降低训练成本和提升模型品质是关键。面对不确定性,他建议寻找历史规律,不断适应新技术的发展。
原文链接
本文链接:https://kx.umi6.com/article/10564.html
转载请注明文章出处
相关推荐
.png)
换一换
上海累计82款大模型通过备案
2025-07-10 11:28:53
大模型即OS,AI云即计算机:阿里的全栈赌注
2025-09-25 10:00:29
GPT-5能让普通人变成博士,但魔法依旧没有
2025-08-08 12:10:14
离线智能,什么时候迎来DeepSeek 时刻?
2025-07-26 14:41:20
Q2财报启示录:AI为大厂们带来了新「钱景」
2025-09-03 14:46:42
大厂「AI」智能体,等待 DeepSeek 时刻
2025-07-31 11:05:08
两部门:到2027年推动五个以上专业大模型在电网、发电、煤炭、油气等行业深度应用
2025-09-08 10:56:26
英伟达新研究:小模型才是智能体的未来
2025-08-19 08:54:39
阿里、智谱等扎堆发布大模型 编程、金融等方向成焦点
2025-07-30 20:55:52
中国信通院开展面向大模型的全栈国产软硬件系统适配测试工作
2025-07-23 16:55:22
国产模型+国产芯片“蜜月期”开启!DeepSeek、智谱密集上新 华为、寒武纪芯片火速适配
2025-09-30 21:35:35
大模型产生幻觉 全怪人类PUA吗
2025-09-12 01:04:40
31亿!我国大模型应用个人用户注册“爆表” 竟超全国人口规模2倍多
2025-07-31 12:06:11
549 文章
250679 浏览
24小时热文
更多

-
2025-10-23 21:15:29
-
2025-10-23 20:16:19
-
2025-10-23 20:15:12