1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:面壁者决心“破壁”

近日,面壁智能首席科学家刘知远在2024中国人工智能大会上表示,大模型不应局限于少数几个,未来将如CPU般普及。他强调降低成本的重要性,使每个人都能拥有大模型,改善生活、学习和工作。

刘知远指出,当前数据接近耗尽,模型训练面临瓶颈,但他认为通过强化学习或合成数据仍可突破。一年前,他就预见了这一问题,认为国内很快会有五六家达到GPT-4水平的模型,商业竞争激烈。因此,面壁智能专注于端侧模型,降低成本并提高性能。

刘知远还提出了大模型密度定律(Densing Law),即模型能力密度随时间呈指数级增长。这类似于摩尔定律,意味着更少参数也能实现相同效果,从而拓宽应用场景。

面对llya关于预训练终结的观点,刘知远认为数据和算力都是关键问题,解决方案需进一步探讨。国内已有公司放弃预训练,他认为这是理性选择。未来,端侧模型的发展趋势将越来越明显。

刘知远强调,降低训练成本和提升模型品质是关键。面对不确定性,他建议寻找历史规律,不断适应新技术的发展。

原文链接
本文链接:https://kx.umi6.com/article/10564.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
上海加速布局具身智能产业:2025张江具身智能开发者大会暨国际人形机器人技能大赛成功举行
2025-05-30 16:53:20
上海蚂蚁灵波科技有限公司成立 注册资本1亿元
2024-12-17 17:13:02
谷歌前 CEO 施密特:若 AI 开始自我改进,我们应“认真考虑”暂停它
2024-12-23 19:02:36
24小时热文
更多
扫一扫体验小程序