1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

英伟达新研究:小模型才是智能体的未来

大模型虽强大,但并非万能。英伟达最新研究指出,在Agent任务中,小语言模型比大模型更具经济性和灵活性,尤其在处理重复性、专业化子任务时表现更优。网友实测也显示,6.7B参数的Toolformer在学会调用API后性能超越了175B的GPT-3,而7B参数的DeepSeek-R1-Distill推理表现胜过Claude 3.5和GPT-4o。

小模型的优势源于两方面优化:硬件资源与任务设计。由于体积小巧,小模型在GPU上可高效共享资源,并行运行多个负载的同时保持性能隔离,显存占用更低,支持超分配机制以提升并发能力。此外,GPU资源可根据需求灵活划分,实现异构负载调度,同时通过优先处理低延迟请求,兼顾吞吐量与成本控制。

在任务层面,Agent任务多为重复性、范围明确的操作,例如文档总结、信息提取或工具调用。这些任务无需通用大模型,而是可以通过专业微调的小模型完成每个子任务,从而避免资源浪费并降低推理成本。运行一个70亿参数的小模型比700-1750亿参数的大模型便宜10-30倍,且更适合本地或边缘部署。

然而,小模型也面临挑战。一方面,其在应对复杂或偏离预设流程的情况时可能不够鲁棒;另一方面,当前基础设施多为大模型优化设计,市场认知度较低,评估标准尚不完善。对此,英伟达建议结合不同规模模型,逐步将大模型转换为针对特定任务的小模型,构建持续反馈闭环以优化性能。

围绕这一观点,网友们展开了热烈讨论。有人认为小模型在简单任务中更具成本效益,也有声音指出其在复杂场景下可能缺乏适应性。正如Unix哲学所倡导的“一个程序只做好一件事”,小模型将复杂系统拆解为模块化组件,但如何平衡功能多样性和操作复杂度仍是关键问题。

参考链接:
[1] https://x.com/ihteshamit/status/1957089843382829262
[2] https://cobusgreyling.medium.com/nvidia-says-small-language-models-are-the-future-of-Agentic-ai-f1f7289d9565
[3] https://www.theriseunion.com/en/blog/Small-LLMs-are-future-of-AgenticAI.html
[4] https://arxiv.org/abs/2506.02153

原文链接
本文链接:https://kx.umi6.com/article/23771.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
阶跃星辰杀入季后赛,强势跻身AI“新六小虎”第一梯队
2026-02-27 15:48:37
拒绝“概念”要“实效”:百度智能云详解Agent Infra如何让智能体成为真正生产力
2025-11-17 20:39:52
Moltbot作者被Claude刁难后:MiniMax M2.1是最优秀的开源模型
2026-01-29 14:21:07
2025最大赌注:为什么所有厂商都押宝AI手机?
2025-12-25 09:25:38
智谱上市后首份财报:超7.24亿元!国内收入最高大模型公司,MaaS发力了
2026-03-31 21:04:07
GAIR 2025 世界模型论坛:走向真实智能的起点
2025-11-30 16:20:12
1美金时薪雇个全栈替身,MiniMax M2.5让打工人也能体验当老板的感觉
2026-02-13 12:18:25
雷军宣布:小米AI人才招聘专项正式启动!
2026-03-30 16:59:23
从能力到商品:Skills市场正在重塑开发者的生产方式
2026-03-20 23:10:33
腾讯升级大模型研发架构 前OpenAI顶尖研究员出任首席AI科学家
2025-12-17 18:59:08
前阿里千问负责人林俊旸离职后首发长文:从训练模型转向训练智能体
2026-03-27 15:04:39
我国大模型密集落地 新技术加速普惠应用
2026-02-14 12:17:30
「斯坦福AI小镇」创业即获投1亿美元!李飞飞卡帕西都投了
2026-02-14 17:33:09
24小时热文
更多
扫一扫体验小程序