标题:面壁者决心“破壁”
近日,面壁智能首席科学家刘知远在2024中国人工智能大会上表示,大模型不应局限于少数几个,未来将如CPU般普及。他强调降低成本的重要性,使每个人都能拥有大模型,改善生活、学习和工作。
刘知远指出,当前数据接近耗尽,模型训练面临瓶颈,但他认为通过强化学习或合成数据仍可突破。一年前,他就预见了这一问题,认为国内很快会有五六家达到GPT-4水平的模型,商业竞争激烈。因此,面壁智能专注于端侧模型,降低成本并提高性能。
刘知远还提出了大模型密度定律(Densing Law),即模型能力密度随时间呈指数级增长。这类似于摩尔定律,意味着更少参数也能实现相同效果,从而拓宽应用场景。
面对llya关于预训练终结的观点,刘知远认为数据和算力都是关键问题,解决方案需进一步探讨。国内已有公司放弃预训练,他认为这是理性选择。未来,端侧模型的发展趋势将越来越明显。
刘知远强调,降低训练成本和提升模型品质是关键。面对不确定性,他建议寻找历史规律,不断适应新技术的发展。
原文链接
本文链接:https://kx.umi6.com/article/10564.html
转载请注明文章出处
相关推荐
.png)
换一换
上海加速布局具身智能产业:2025张江具身智能开发者大会暨国际人形机器人技能大赛成功举行
2025-05-30 16:53:20
上海蚂蚁灵波科技有限公司成立 注册资本1亿元
2024-12-17 17:13:02
谷歌前 CEO 施密特:若 AI 开始自我改进,我们应“认真考虑”暂停它
2024-12-23 19:02:36
461 文章
65723 浏览
24小时热文
更多

-
2025-07-19 10:50:54
-
2025-07-19 09:50:33
-
2025-07-19 07:49:30