1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

英伟达新研究:小模型才是智能体的未来

大模型虽强大,但并非万能。英伟达最新研究指出,在Agent任务中,小语言模型比大模型更具经济性和灵活性,尤其在处理重复性、专业化子任务时表现更优。网友实测也显示,6.7B参数的Toolformer在学会调用API后性能超越了175B的GPT-3,而7B参数的DeepSeek-R1-Distill推理表现胜过Claude 3.5和GPT-4o。

小模型的优势源于两方面优化:硬件资源与任务设计。由于体积小巧,小模型在GPU上可高效共享资源,并行运行多个负载的同时保持性能隔离,显存占用更低,支持超分配机制以提升并发能力。此外,GPU资源可根据需求灵活划分,实现异构负载调度,同时通过优先处理低延迟请求,兼顾吞吐量与成本控制。

在任务层面,Agent任务多为重复性、范围明确的操作,例如文档总结、信息提取或工具调用。这些任务无需通用大模型,而是可以通过专业微调的小模型完成每个子任务,从而避免资源浪费并降低推理成本。运行一个70亿参数的小模型比700-1750亿参数的大模型便宜10-30倍,且更适合本地或边缘部署。

然而,小模型也面临挑战。一方面,其在应对复杂或偏离预设流程的情况时可能不够鲁棒;另一方面,当前基础设施多为大模型优化设计,市场认知度较低,评估标准尚不完善。对此,英伟达建议结合不同规模模型,逐步将大模型转换为针对特定任务的小模型,构建持续反馈闭环以优化性能。

围绕这一观点,网友们展开了热烈讨论。有人认为小模型在简单任务中更具成本效益,也有声音指出其在复杂场景下可能缺乏适应性。正如Unix哲学所倡导的“一个程序只做好一件事”,小模型将复杂系统拆解为模块化组件,但如何平衡功能多样性和操作复杂度仍是关键问题。

参考链接:
[1] https://x.com/ihteshamit/status/1957089843382829262
[2] https://cobusgreyling.medium.com/nvidia-says-small-language-models-are-the-future-of-Agentic-ai-f1f7289d9565
[3] https://www.theriseunion.com/en/blog/Small-LLMs-are-future-of-AgenticAI.html
[4] https://arxiv.org/abs/2506.02153

原文链接
本文链接:https://kx.umi6.com/article/23771.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
Gartner首次发布大模型报告:火山引擎排名中国厂商第一
2025-11-20 12:17:36
腾讯宣布升级大模型研发架构 前OpenAI研究员姚顺雨任要职
2025-12-17 17:58:49
AI变革将是未来十年的周期
2025-10-20 17:12:11
用DeepSeek改造ERP,到底难在哪?怎么破?
2025-10-11 09:33:30
擘画2-5年AI新版图 闽浙粤竞速算力与智能体
2025-11-08 17:52:42
微软亮剑智能办公:解决“知行不一”难题,让 AI 替你干活、老板还夸你效率高
2025-11-18 11:12:22
月之暗面 Kimi 创始人杨植麟:中国技术不仅要好用还要参与制定规则,未来大模型要推出到 K100
2026-01-12 09:22:11
突然走红的高校“AI小镇”项目,让AI卷到学会加班
2025-09-17 08:24:18
拒绝“概念”要“实效”:百度智能云详解Agent Infra如何让智能体成为真正生产力
2025-11-17 20:39:52
顶尖技术+标准产品+创新模式+可靠服务,打造大模型商业落地中国范式
2025-12-16 10:32:22
智谱、MiniMax争夺「大模型第一股」
2025-12-24 10:30:23
阿里巴巴CEO吴泳铭:大模型是下一代操作系统 AI Cloud是下一代计算机
2025-09-24 10:37:04
你用的大模型是什么MBTI?
2025-09-23 20:23:14
24小时热文
更多
扫一扫体验小程序