标题:面壁者决心“破壁”
近日,面壁智能首席科学家刘知远在2024中国人工智能大会上表示,大模型不应局限于少数几个,未来将如CPU般普及。他强调降低成本的重要性,使每个人都能拥有大模型,改善生活、学习和工作。
刘知远指出,当前数据接近耗尽,模型训练面临瓶颈,但他认为通过强化学习或合成数据仍可突破。一年前,他就预见了这一问题,认为国内很快会有五六家达到GPT-4水平的模型,商业竞争激烈。因此,面壁智能专注于端侧模型,降低成本并提高性能。
刘知远还提出了大模型密度定律(Densing Law),即模型能力密度随时间呈指数级增长。这类似于摩尔定律,意味着更少参数也能实现相同效果,从而拓宽应用场景。
面对llya关于预训练终结的观点,刘知远认为数据和算力都是关键问题,解决方案需进一步探讨。国内已有公司放弃预训练,他认为这是理性选择。未来,端侧模型的发展趋势将越来越明显。
刘知远强调,降低训练成本和提升模型品质是关键。面对不确定性,他建议寻找历史规律,不断适应新技术的发展。
原文链接
本文链接:https://kx.umi6.com/article/10564.html
转载请注明文章出处
相关推荐
换一换
开源模型TOP5,被中国厂商包圆了
2025-10-15 17:36:49
两部门:到2027年推动五个以上专业大模型在电网、发电、煤炭、油气等行业深度应用
2025-09-08 10:56:26
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026
2025-12-22 10:34:39
用DeepSeek改造ERP,到底难在哪?怎么破?
2025-10-11 09:33:30
上海:推动医疗器械相关垂类大模型研发应用
2025-09-15 16:02:14
清华孙茂松:对工业界而言,大厂可以Scaling,其他玩家重在垂直应用 | MEET2026
2025-12-21 10:35:20
大模型驱动算力革命 AI芯片迎破局新机遇
2025-09-18 07:47:51
卖酒的茅台要学AI了!和奔驰麦当劳一起拜师百度
2025-08-17 12:35:45
字节跳动、阿里AI“大将”出走 大模型厂商中高层流动持续
2025-08-25 21:35:41
推理成本骤降75%!gpt-oss用新数据类型实现4倍推理速度,80GB显卡能跑1200亿参数大模型
2025-08-11 16:04:21
李飞飞的答案:大模型之后,Agent向何处去?
2025-09-05 09:13:59
「今年业务是去年5倍以上」,工业智能体掀热潮
2025-08-29 12:38:30
智谱AI,排名「第二」
2025-12-21 12:41:26
653 文章
424177 浏览
24小时热文
更多
-
2026-01-23 00:20:44 -
2026-01-22 23:18:34 -
2026-01-22 23:17:29