模型压缩 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

大厂做不好的Local Agent为何难？

2025年下半年，AI行业面临大模型边际收益递减的困境，训练成本接近10亿美元。然而，小模型逆袭趋势显现，DeepSeek R1-0528将671B参数模型蒸馏至8B，性能反超10%。英伟达研究显示，小于100亿参数的小模型在多数任务中媲美甚至超越大模型，成本仅为1/10到1/30。产业从“参数竞赛”转向“效率革命”，AI逐步走向端侧设备。GreenBitAI推出专业级Local Agent产品Libra，支持完全本地化运行，满足隐私需求，性能媲美云端模型。Libra专注文档处理、离线运行和高性能体验，验证了消费级硬件上流畅运行专业级AI的可能性。GreenBitAI计划通过ToC订阅、ToB授权及平台化生态三步走战略，推动端侧AI普及，目标成为端侧AI基础设施提供商。

原文链接

数码游侠

11-13 08:47:14

AI模型压缩

Local Agent

端侧智能

分享至

打开微信扫一扫

内容投诉

生成图片

上交大冷静文：模型发展需要和芯片、系统厂商协同

标题：上交大冷静文：模型发展需芯片与系统协同近期，上海交通大学与魔形智能联合研究团队在 HPCA 2025 会议上发表论文《VQ-LLM: High-performance Code Generation for Vector Quantization Augmented LLM Infere...

原文链接

WisdomTrail

04-30 20:26:59

向量量化

国产芯片

大模型压缩

分享至

打开微信扫一扫

内容投诉

生成图片

被DeepSeek带火的知识蒸馏开山之作曾被拒：诺奖得主坐镇都没用

Hinton、Oriol Vinyals、Jeff Dean合著的《Distilling the Knowledge in a Neural Network》论文，首次提出知识蒸馏概念，大幅提升模型压缩效率。尽管由深度学习之父Hinton等三位大佬撰写，该论文仍遭NeurIPS 2014拒收，理由是缺乏创新和影响力。知识蒸馏技术让模型能在保持准确率的情况下大幅压缩参数，使Siri等应用得以部署。论文提出用软目标替代硬目标，通过调整温度参数T来优化训练。实验显示，知识蒸馏在多个领域均取得显著成果，成为行业标配。

原文链接

幻彩逻辑RainbowLogic

02-07 18:04:58

Hinton

模型压缩

知识蒸馏

分享至

打开微信扫一扫

内容投诉

生成图片

单卡搞定Llama 3.1 405B，让大模型轻松瘦身！超强压缩工具包来了

单卡搞定Llama 3.1 405B，让大模型轻松瘦身！超强压缩工具包来了近期，Llama-3.1登顶开源领域，其405B版本模型对资源提出了更高要求，高达900多GB的内存需求。为应对这一挑战，北航、商汤、南洋理工等团队联手研发出大模型压缩工具与基准LLMC，使一张80G A100显卡就能完成L...

原文链接