1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

英伟达新研究:小模型才是智能体的未来

大模型虽强大,但并非万能。英伟达最新研究指出,在Agent任务中,小语言模型比大模型更具经济性和灵活性,尤其在处理重复性、专业化子任务时表现更优。网友实测也显示,6.7B参数的Toolformer在学会调用API后性能超越了175B的GPT-3,而7B参数的DeepSeek-R1-Distill推理表现胜过Claude 3.5和GPT-4o。

小模型的优势源于两方面优化:硬件资源与任务设计。由于体积小巧,小模型在GPU上可高效共享资源,并行运行多个负载的同时保持性能隔离,显存占用更低,支持超分配机制以提升并发能力。此外,GPU资源可根据需求灵活划分,实现异构负载调度,同时通过优先处理低延迟请求,兼顾吞吐量与成本控制。

在任务层面,Agent任务多为重复性、范围明确的操作,例如文档总结、信息提取或工具调用。这些任务无需通用大模型,而是可以通过专业微调的小模型完成每个子任务,从而避免资源浪费并降低推理成本。运行一个70亿参数的小模型比700-1750亿参数的大模型便宜10-30倍,且更适合本地或边缘部署。

然而,小模型也面临挑战。一方面,其在应对复杂或偏离预设流程的情况时可能不够鲁棒;另一方面,当前基础设施多为大模型优化设计,市场认知度较低,评估标准尚不完善。对此,英伟达建议结合不同规模模型,逐步将大模型转换为针对特定任务的小模型,构建持续反馈闭环以优化性能。

围绕这一观点,网友们展开了热烈讨论。有人认为小模型在简单任务中更具成本效益,也有声音指出其在复杂场景下可能缺乏适应性。正如Unix哲学所倡导的“一个程序只做好一件事”,小模型将复杂系统拆解为模块化组件,但如何平衡功能多样性和操作复杂度仍是关键问题。

参考链接:
[1] https://x.com/ihteshamit/status/1957089843382829262
[2] https://cobusgreyling.medium.com/nvidia-says-small-language-models-are-the-future-of-Agentic-ai-f1f7289d9565
[3] https://www.theriseunion.com/en/blog/Small-LLMs-are-future-of-AgenticAI.html
[4] https://arxiv.org/abs/2506.02153

原文链接
本文链接:https://kx.umi6.com/article/23771.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
推理成本骤降75%!gpt-oss用新数据类型实现4倍推理速度,80GB显卡能跑1200亿参数大模型
2025-08-11 16:04:21
手机端侧AI轻量化演进:3B模型渐成主流 智能体标准亟待完善
2025-10-11 13:30:31
DeepMind哈萨比斯:智能体可以在Genie实时生成的世界里运行
2025-08-13 15:36:41
大模型激战正酣!大厂节前、节中进展不停 争夺下一代操作系统主导权
2025-10-05 18:23:27
华为发布面向智能世界2035十大技术趋势:AGI走向物理世界、算力增长10万倍
2025-09-17 07:23:41
高性能计算群星闪耀时
2025-08-21 12:35:24
把枯燥的工作先扔给大模型?
2025-08-15 12:12:45
字节跳动、阿里AI“大将”出走
2025-08-25 22:35:04
港股AGI第一股“云知声”首战告捷:大模型贡献1亿收入,单客价直线提升116.2%,AI保险业务暴涨1386.8%
2025-08-29 20:43:34
智谱与市城投集团合作发布杭州城投人工智能产业大模型项目(一期)建设成果
2025-09-15 20:01:43
开源 AI 模型 TOP5,被中国厂商包圆
2025-10-15 18:39:57
DeepSeek删豆包冲上热搜,大模型世子之争演都不演了
2025-08-21 13:31:42
谷歌DeepMind:AI独立创造价值的经济层正在形成
2025-09-16 15:13:08
24小时热文
更多
扫一扫体验小程序