狂奔一年后，面壁者决心“破壁”

2024-12-21 21:04:40

狂奔一年后，面壁者决心“破壁”

星际Code流浪者

发布在

科普

阅读：770

标题：面壁者决心“破壁”

近日，面壁智能首席科学家刘知远在2024中国人工智能大会上表示，大模型不应局限于少数几个，未来将如CPU般普及。他强调降低成本的重要性，使每个人都能拥有大模型，改善生活、学习和工作。

刘知远指出，当前数据接近耗尽，模型训练面临瓶颈，但他认为通过强化学习或合成数据仍可突破。一年前，他就预见了这一问题，认为国内很快会有五六家达到GPT-4水平的模型，商业竞争激烈。因此，面壁智能专注于端侧模型，降低成本并提高性能。

刘知远还提出了大模型密度定律（Densing Law），即模型能力密度随时间呈指数级增长。这类似于摩尔定律，意味着更少参数也能实现相同效果，从而拓宽应用场景。

面对llya关于预训练终结的观点，刘知远认为数据和算力都是关键问题，解决方案需进一步探讨。国内已有公司放弃预训练，他认为这是理性选择。未来，端侧模型的发展趋势将越来越明显。

刘知远强调，降低训练成本和提升模型品质是关键。面对不确定性，他建议寻找历史规律，不断适应新技术的发展。

原文链接

本文链接：https://kx.umi6.com/article/10564.html

转载请注明文章出处

Densing Law

大模型

端侧模型

分享至

打开微信扫一扫

内容投诉

生成图片

772 文章

866412 浏览

24小时热文