标题:对话中国信通院魏凯:AI下半场,大模型要少说话,多做事
今年2月,DeepSeek爆火,而中国信通院早在之前就观察到国内大模型性能快速提升。魏凯表示,2024年多个团队持续优化模型,每月都有新进展。例如,DeepSeek在4月排名靠后,8月进入前十,12月发布的DeepSeek-V3成为基础能力第一名,并且是开源的。
中国信通院承担人工智能领域标准制定、评测等任务,2023年推出“方升”大模型基准测试体系,构建了近700万条测试数据集,旨在推动标准化测试,防止刷榜作弊。2024年底,魏凯担任工业和信息化部人工智能标准化技术委员会秘书长。
魏凯认为,大模型从生成式走向代理型是趋势,应减少输出信息,提高执行能力。他指出,大模型不是万能的,需结合数据库、知识库等工具,才能真正发挥作用。同时,Agent作为应用程序,能调用工具完成复杂任务,未来可能发展为数字员工,助力个人或企业提升效率。
此外,魏凯强调,大模型的发展需要长期投入,预训练和后训练各有价值。当前,测试基准对模型发展至关重要,中国信通院的“方升”体系注重产业实战应用,避免依赖开源数据,确保评测公正性。未来,大模型将更关注任务规划、深度研究等能力,以更好地服务实体经济。
原文链接
本文链接:https://kx.umi6.com/article/20988.html
转载请注明文章出处
相关推荐
换一换
5.20 明天见!拿好这份参会指南|AIGC2026峰会
2026-05-19 12:29:51
腾讯升级大模型研发架构 前OpenAI顶尖研究员出任首席AI科学家
2025-12-17 18:59:08
阿里 Qwen 技术负责人林俊旸:模型即产品,做模型就是在做产品
2026-01-12 09:26:44
我国大模型密集落地 新技术加速普惠应用
2026-02-14 12:17:30
杨植麟当主持人的大模型圆桌:张鹏罗福莉夏立雪都放开说了
2026-03-27 23:23:11
清华孙茂松:对工业界而言,大厂可以Scaling,其他玩家重在垂直应用 | MEET2026
2025-12-21 10:35:20
智谱首份业绩报告:商业化全面爆发,Maas平台ARR达17亿元提升60倍
2026-03-31 18:02:15
当年带你上网冲浪的头号老玩家,这回是真AI上头了
2025-12-19 15:57:55
美国AI春晚,一盆凉水浇在Agent身上
2025-12-10 16:57:11
长三角一体化大模型发布 AI将为区域发展提供决策支撑
2026-01-12 09:40:07
美团内测万亿级新一代大模型,全程基于国产算力集群训练
2026-04-24 12:12:33
顶尖技术+标准产品+创新模式+可靠服务,打造大模型商业落地中国范式
2025-12-16 10:32:22
2026 年 AI 行业的真正瓶颈不是模型?
2026-01-21 13:12:13
706 文章
643983 浏览
24小时热文
更多
-
2026-06-09 00:54:40 -
2026-06-09 00:53:08 -
2026-06-08 23:49:41