1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

英伟达新研究:小模型才是智能体的未来

大模型虽强大,但并非万能。英伟达最新研究指出,在Agent任务中,小语言模型比大模型更具经济性和灵活性,尤其在处理重复性、专业化子任务时表现更优。网友实测也显示,6.7B参数的Toolformer在学会调用API后性能超越了175B的GPT-3,而7B参数的DeepSeek-R1-Distill推理表现胜过Claude 3.5和GPT-4o。

小模型的优势源于两方面优化:硬件资源与任务设计。由于体积小巧,小模型在GPU上可高效共享资源,并行运行多个负载的同时保持性能隔离,显存占用更低,支持超分配机制以提升并发能力。此外,GPU资源可根据需求灵活划分,实现异构负载调度,同时通过优先处理低延迟请求,兼顾吞吐量与成本控制。

在任务层面,Agent任务多为重复性、范围明确的操作,例如文档总结、信息提取或工具调用。这些任务无需通用大模型,而是可以通过专业微调的小模型完成每个子任务,从而避免资源浪费并降低推理成本。运行一个70亿参数的小模型比700-1750亿参数的大模型便宜10-30倍,且更适合本地或边缘部署。

然而,小模型也面临挑战。一方面,其在应对复杂或偏离预设流程的情况时可能不够鲁棒;另一方面,当前基础设施多为大模型优化设计,市场认知度较低,评估标准尚不完善。对此,英伟达建议结合不同规模模型,逐步将大模型转换为针对特定任务的小模型,构建持续反馈闭环以优化性能。

围绕这一观点,网友们展开了热烈讨论。有人认为小模型在简单任务中更具成本效益,也有声音指出其在复杂场景下可能缺乏适应性。正如Unix哲学所倡导的“一个程序只做好一件事”,小模型将复杂系统拆解为模块化组件,但如何平衡功能多样性和操作复杂度仍是关键问题。

参考链接:
[1] https://x.com/ihteshamit/status/1957089843382829262
[2] https://cobusgreyling.medium.com/nvidia-says-small-language-models-are-the-future-of-Agentic-ai-f1f7289d9565
[3] https://www.theriseunion.com/en/blog/Small-LLMs-are-future-of-AgenticAI.html
[4] https://arxiv.org/abs/2506.02153

原文链接
本文链接:https://kx.umi6.com/article/23771.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
AI变革将是未来十年的周期
2025-10-20 17:12:11
腾讯调整大模型组织架构:姚顺雨加盟,向总裁刘炽平汇报
2025-12-18 15:51:59
杭州“十五五”规划建议:实施大模型前沿技术攻关和高端芯片、基础软件、模型算法等研发计划 建设人工智能开源社区
2026-01-16 11:34:57
宇树科技王兴兴:谁能把机器人用的大模型做出来 谁就是全世界最厉害的AI公司和机器人公司
2026-01-30 12:25:48
Kimi K2 Thinking突袭!智能体&推理能力超GPT-5,网友:再次缩小开源闭源差距
2025-11-07 10:43:45
阿里千问大模型换将,32岁林俊旸官宣告别
2026-03-04 10:27:38
擘画2-5年AI新版图 闽浙粤竞速算力与智能体
2025-11-08 17:52:42
中国中文信息学会2025学术年会暨第二届中国大模型大会(CIPS & CLM 2025)于10月28日在北京盛大开幕
2025-10-30 18:52:50
IDC:预测到2026年70%的组织将采用融合生成式、处方式、预测式和智能体技术的复合AI
2025-10-27 16:14:29
MEET2026挤爆了,AI圈今年最该听的20+场演讲&对谈都在这
2025-12-11 15:57:49
开源模型TOP5,被中国厂商包圆了
2025-10-15 17:36:49
拒绝“概念”要“实效”:百度智能云详解Agent Infra如何让智能体成为真正生产力
2025-11-17 20:39:52
几乎都在挂羊头卖狗肉!AI Agent泡沫实在太大了
2025-10-20 11:04:42
24小时热文
更多
扫一扫体验小程序