1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

英伟达新研究:小模型才是智能体的未来

大模型虽强大,但并非万能。英伟达最新研究指出,在Agent任务中,小语言模型比大模型更具经济性和灵活性,尤其在处理重复性、专业化子任务时表现更优。网友实测也显示,6.7B参数的Toolformer在学会调用API后性能超越了175B的GPT-3,而7B参数的DeepSeek-R1-Distill推理表现胜过Claude 3.5和GPT-4o。

小模型的优势源于两方面优化:硬件资源与任务设计。由于体积小巧,小模型在GPU上可高效共享资源,并行运行多个负载的同时保持性能隔离,显存占用更低,支持超分配机制以提升并发能力。此外,GPU资源可根据需求灵活划分,实现异构负载调度,同时通过优先处理低延迟请求,兼顾吞吐量与成本控制。

在任务层面,Agent任务多为重复性、范围明确的操作,例如文档总结、信息提取或工具调用。这些任务无需通用大模型,而是可以通过专业微调的小模型完成每个子任务,从而避免资源浪费并降低推理成本。运行一个70亿参数的小模型比700-1750亿参数的大模型便宜10-30倍,且更适合本地或边缘部署。

然而,小模型也面临挑战。一方面,其在应对复杂或偏离预设流程的情况时可能不够鲁棒;另一方面,当前基础设施多为大模型优化设计,市场认知度较低,评估标准尚不完善。对此,英伟达建议结合不同规模模型,逐步将大模型转换为针对特定任务的小模型,构建持续反馈闭环以优化性能。

围绕这一观点,网友们展开了热烈讨论。有人认为小模型在简单任务中更具成本效益,也有声音指出其在复杂场景下可能缺乏适应性。正如Unix哲学所倡导的“一个程序只做好一件事”,小模型将复杂系统拆解为模块化组件,但如何平衡功能多样性和操作复杂度仍是关键问题。

参考链接:
[1] https://x.com/ihteshamit/status/1957089843382829262
[2] https://cobusgreyling.medium.com/nvidia-says-small-language-models-are-the-future-of-Agentic-ai-f1f7289d9565
[3] https://www.theriseunion.com/en/blog/Small-LLMs-are-future-of-AgenticAI.html
[4] https://arxiv.org/abs/2506.02153

原文链接
本文链接:https://kx.umi6.com/article/23771.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
中金:2026年大模型在强化学习、模型记忆、上下文工程等方面将取得更多突破
2026-02-05 08:39:59
大模型收入暴涨1076%,港股AGI第一股首份年报:一年狂揽12亿,属实把商业化玩明白了
2026-03-27 17:08:13
真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026
2025-12-22 10:35:49
企业软件底层逻辑脱胎换骨:从席位订阅到决策订阅,下一个万亿公司属于这类玩家
2026-03-27 16:05:26
企业级智能体落地,谁没踩这四种大坑?无问芯穹的系统性解法来了
2025-12-16 20:58:23
豆包大模型2.0正式发布
2026-02-14 14:23:01
火线解析智谱AI招股书:年营收3亿增速130%,率先冲刺全球大模型第一股
2025-12-19 23:14:23
不整虚的!中美AI同步加速:47天30次更新,中国AI的最强主场究竟在哪?
2026-02-22 18:50:22
阿里千问大模型换将,32岁林俊旸官宣告别
2026-03-04 10:27:38
“京东 AI 购”独立 App 内测,能让智能体帮忙购物、点外卖
2025-12-26 12:37:00
像素蛋糕9.0:一场关于AI与修图的颠覆革命
2026-04-07 16:02:08
「斯坦福AI小镇」创业即获投1亿美元!李飞飞卡帕西都投了
2026-02-14 17:33:09
覆盖20多个垂直场景Agent!腾讯首发效率智能体工具集
2026-06-05 17:08:27
24小时热文
更多
扫一扫体验小程序