标题:对话中国信通院魏凯:AI下半场,大模型要少说话,多做事
今年2月,DeepSeek爆火,而中国信通院早在之前就观察到国内大模型性能快速提升。魏凯表示,2024年多个团队持续优化模型,每月都有新进展。例如,DeepSeek在4月排名靠后,8月进入前十,12月发布的DeepSeek-V3成为基础能力第一名,并且是开源的。
中国信通院承担人工智能领域标准制定、评测等任务,2023年推出“方升”大模型基准测试体系,构建了近700万条测试数据集,旨在推动标准化测试,防止刷榜作弊。2024年底,魏凯担任工业和信息化部人工智能标准化技术委员会秘书长。
魏凯认为,大模型从生成式走向代理型是趋势,应减少输出信息,提高执行能力。他指出,大模型不是万能的,需结合数据库、知识库等工具,才能真正发挥作用。同时,Agent作为应用程序,能调用工具完成复杂任务,未来可能发展为数字员工,助力个人或企业提升效率。
此外,魏凯强调,大模型的发展需要长期投入,预训练和后训练各有价值。当前,测试基准对模型发展至关重要,中国信通院的“方升”体系注重产业实战应用,避免依赖开源数据,确保评测公正性。未来,大模型将更关注任务规划、深度研究等能力,以更好地服务实体经济。
原文链接
本文链接:https://kx.umi6.com/article/20988.html
转载请注明文章出处
相关推荐
换一换
1300000000000000!谷歌每月Tokens消耗量曝光(别数了是千万亿)
2025-10-11 09:26:13
Scaling Law再遭质疑:“退化式AI”竟成终局?
2025-08-04 21:03:25
智谱旗舰模型GLM-4.5重磅发布 相关企业有望站上风口
2025-07-29 08:27:00
超越AGI,阿里剑指“超级智能”
2025-09-24 18:49:07
字节跳动、阿里AI“大将”出走
2025-08-25 22:35:04
开源模型TOP5,被中国厂商包圆了
2025-10-15 17:36:49
把枯燥的工作先扔给大模型?
2025-08-15 12:12:45
腾讯发布全新大模型混元3D 3.0
2025-09-16 10:11:57
智谱推出 AutoGLM 2.0:给每个手机都装上通用 Agent
2025-08-20 16:15:09
国产模型+国产芯片“蜜月期”开启!DeepSeek、智谱密集上新 华为、寒武纪芯片火速适配
2025-09-30 21:35:35
真正的AI竞争力,藏在大模型“后训练”这一步
2025-10-13 16:59:55
开源 AI 模型 TOP5,被中国厂商包圆
2025-10-15 18:39:57
汪军对话 Rich Sutton:大模型在一定程度上分散了我们对智能理解的注意力
2025-09-28 11:53:51
579 文章
366254 浏览
24小时热文
更多
-
2025-12-08 17:39:25 -
2025-12-08 17:37:43 -
2025-12-08 16:38:29