1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:对话中国信通院魏凯:AI下半场,大模型要少说话,多做事

今年2月,DeepSeek爆火,而中国信通院早在之前就观察到国内大模型性能快速提升。魏凯表示,2024年多个团队持续优化模型,每月都有新进展。例如,DeepSeek在4月排名靠后,8月进入前十,12月发布的DeepSeek-V3成为基础能力第一名,并且是开源的。

中国信通院承担人工智能领域标准制定、评测等任务,2023年推出“方升”大模型基准测试体系,构建了近700万条测试数据集,旨在推动标准化测试,防止刷榜作弊。2024年底,魏凯担任工业和信息化部人工智能标准化技术委员会秘书长。

魏凯认为,大模型从生成式走向代理型是趋势,应减少输出信息,提高执行能力。他指出,大模型不是万能的,需结合数据库、知识库等工具,才能真正发挥作用。同时,Agent作为应用程序,能调用工具完成复杂任务,未来可能发展为数字员工,助力个人或企业提升效率。

此外,魏凯强调,大模型的发展需要长期投入,预训练和后训练各有价值。当前,测试基准对模型发展至关重要,中国信通院的“方升”体系注重产业实战应用,避免依赖开源数据,确保评测公正性。未来,大模型将更关注任务规划、深度研究等能力,以更好地服务实体经济。

原文链接
本文链接:https://kx.umi6.com/article/20988.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
阿里云副总裁叶杰平:大模型已呈现“周级迭代”爆发态势
2025-07-27 13:59:57
中国企业调用大模型日均超10万亿Tokens
2025-09-01 12:17:48
AI 语音爆发的这半年,一位“局中人”看到的赛道爆发逻辑
2025-07-03 12:21:05
当AI智能体走进诊室,大模型如何颠覆医疗?
2025-07-30 13:48:25
讯飞星火 X1 升级版模型宣布上线:整体效果对标 OpenAI o3 等国内外一流大模型
2025-07-25 14:25:03
数字人,正在逼近盈利线
2025-07-17 12:20:37
李彦宏:百度下一代旗舰大模型研发中 会在准备就绪后尽快发布
2025-08-20 21:19:28
首批“数字员工”组团进大厂!7个岗位干爆KPI,提前锁定年度最佳企业级Agent
2025-08-06 01:20:41
Kimi“憋”出的深度研究,成色几何?
2025-07-01 15:26:59
我国首个发电行业大模型“擎源”发布,模型参数达千亿级别
2025-06-28 20:23:24
北京最猛独角兽,踏进华为、小米的领地
2025-08-27 14:04:00
高性能计算群星闪耀时
2025-08-21 12:35:24
独家|阶跃星辰正进行新一轮融资 金额超5亿美元
2025-07-25 22:31:59
24小时热文
更多
扫一扫体验小程序