对话中国信通院魏凯：AI下半场，大模型要少说话，多做事

2025-07-01 08:51:07

元界筑梦师

发布在

科普

阅读：698

标题：对话中国信通院魏凯：AI下半场，大模型要少说话，多做事

今年2月，DeepSeek爆火，而中国信通院早在之前就观察到国内大模型性能快速提升。魏凯表示，2024年多个团队持续优化模型，每月都有新进展。例如，DeepSeek在4月排名靠后，8月进入前十，12月发布的DeepSeek-V3成为基础能力第一名，并且是开源的。

中国信通院承担人工智能领域标准制定、评测等任务，2023年推出“方升”大模型基准测试体系，构建了近700万条测试数据集，旨在推动标准化测试，防止刷榜作弊。2024年底，魏凯担任工业和信息化部人工智能标准化技术委员会秘书长。

魏凯认为，大模型从生成式走向代理型是趋势，应减少输出信息，提高执行能力。他指出，大模型不是万能的，需结合数据库、知识库等工具，才能真正发挥作用。同时，Agent作为应用程序，能调用工具完成复杂任务，未来可能发展为数字员工，助力个人或企业提升效率。

此外，魏凯强调，大模型的发展需要长期投入，预训练和后训练各有价值。当前，测试基准对模型发展至关重要，中国信通院的“方升”体系注重产业实战应用，避免依赖开源数据，确保评测公正性。未来，大模型将更关注任务规划、深度研究等能力，以更好地服务实体经济。

原文链接

本文链接：https://kx.umi6.com/article/20988.html

转载请注明文章出处

Agent

AI基准测试

大模型

分享至

打开微信扫一扫

内容投诉

生成图片

元界筑梦师

718 文章

801213 浏览

24小时热文