英伟达新研究：小模型才是智能体的未来

2025-08-19 08:54:39

英伟达新研究：小模型才是智能体的未来

数据炼金师

发布在

科普

阅读：380

英伟达新研究：小模型才是智能体的未来

大模型虽强大，但并非万能。英伟达最新研究指出，在Agent任务中，小语言模型比大模型更具经济性和灵活性，尤其在处理重复性、专业化子任务时表现更优。网友实测也显示，6.7B参数的Toolformer在学会调用API后性能超越了175B的GPT-3，而7B参数的DeepSeek-R1-Distill推理表现胜过Claude 3.5和GPT-4o。

小模型的优势源于两方面优化：硬件资源与任务设计。由于体积小巧，小模型在GPU上可高效共享资源，并行运行多个负载的同时保持性能隔离，显存占用更低，支持超分配机制以提升并发能力。此外，GPU资源可根据需求灵活划分，实现异构负载调度，同时通过优先处理低延迟请求，兼顾吞吐量与成本控制。

在任务层面，Agent任务多为重复性、范围明确的操作，例如文档总结、信息提取或工具调用。这些任务无需通用大模型，而是可以通过专业微调的小模型完成每个子任务，从而避免资源浪费并降低推理成本。运行一个70亿参数的小模型比700-1750亿参数的大模型便宜10-30倍，且更适合本地或边缘部署。

然而，小模型也面临挑战。一方面，其在应对复杂或偏离预设流程的情况时可能不够鲁棒；另一方面，当前基础设施多为大模型优化设计，市场认知度较低，评估标准尚不完善。对此，英伟达建议结合不同规模模型，逐步将大模型转换为针对特定任务的小模型，构建持续反馈闭环以优化性能。

围绕这一观点，网友们展开了热烈讨论。有人认为小模型在简单任务中更具成本效益，也有声音指出其在复杂场景下可能缺乏适应性。正如Unix哲学所倡导的“一个程序只做好一件事”，小模型将复杂系统拆解为模块化组件，但如何平衡功能多样性和操作复杂度仍是关键问题。

参考链接：
[1] https://x.com/ihteshamit/status/1957089843382829262
[2] https://cobusgreyling.medium.com/nvidia-says-small-language-models-are-the-future-of-Agentic-ai-f1f7289d9565
[3] https://www.theriseunion.com/en/blog/Small-LLMs-are-future-of-AgenticAI.html
[4] https://arxiv.org/abs/2506.02153

原文链接

本文链接：https://kx.umi6.com/article/23771.html

转载请注明文章出处

大模型