1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:面壁者决心“破壁”

近日,面壁智能首席科学家刘知远在2024中国人工智能大会上表示,大模型不应局限于少数几个,未来将如CPU般普及。他强调降低成本的重要性,使每个人都能拥有大模型,改善生活、学习和工作。

刘知远指出,当前数据接近耗尽,模型训练面临瓶颈,但他认为通过强化学习或合成数据仍可突破。一年前,他就预见了这一问题,认为国内很快会有五六家达到GPT-4水平的模型,商业竞争激烈。因此,面壁智能专注于端侧模型,降低成本并提高性能。

刘知远还提出了大模型密度定律(Densing Law),即模型能力密度随时间呈指数级增长。这类似于摩尔定律,意味着更少参数也能实现相同效果,从而拓宽应用场景。

面对llya关于预训练终结的观点,刘知远认为数据和算力都是关键问题,解决方案需进一步探讨。国内已有公司放弃预训练,他认为这是理性选择。未来,端侧模型的发展趋势将越来越明显。

刘知远强调,降低训练成本和提升模型品质是关键。面对不确定性,他建议寻找历史规律,不断适应新技术的发展。

原文链接
本文链接:https://kx.umi6.com/article/10564.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
马斯克Grok-4碾压所有大模型!“比所有博士聪明”,AIME25拿满分
2025-07-10 16:23:20
大模型隐私安全和公平性有“跷跷板”效应,最佳平衡法则刚刚找到
2025-07-27 21:02:57
字节跳动、阿里AI“大将”出走
2025-08-25 22:35:04
港股AGI第一股“云知声”首战告捷:大模型贡献1亿收入,单客价直线提升116.2%,AI保险业务暴涨1386.8%
2025-08-29 20:43:34
大模型首次直接理解代码图:不用Agent修bug,登顶SWE-Bench开源榜
2025-06-27 15:08:34
人类正在被AI「幻觉」欺骗
2025-08-20 10:10:57
企业管理软件是不是和AI无关?
2025-06-23 13:23:28
一场「狼人杀」,考倒了一堆大模型
2025-08-28 14:28:50
大模型全员0分!谢赛宁领衔华人团队,最新编程竞赛基准出炉,题目每日更新禁止刷题
2025-06-19 10:46:15
大模型又迎来重要玩家!美团首个开源大模型来了
2025-09-01 18:28:28
一年20万台出货,AI 玩具公司Haivivi 刚拿了2亿新融资,我们和创始人聊了聊
2025-08-25 12:30:28
对话中国信通院魏凯:AI下半场,大模型要少说话,多做事
2025-07-01 08:51:07
毕马威报告:中国银行业在大模型落地应用方面走在前列
2025-06-23 16:27:32
24小时热文
更多
扫一扫体验小程序