蒸馏模型 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

纯蒸馏模型 SOTA 出现！直接 SFT 成本直降 50 倍，数据已全部开源

标题：纯蒸馏模型 SOTA 突破！训练成本降低50倍，数据已开源 a-m-team 发布新论文，介绍下一代推理模型的小进展。团队基于 AM-Thinking-v1 数据通过“纯蒸馏”训练的学生模型，在多项高难度推理任务中接近甚至超越当前最优水平（SOTA），成本仅为传统方法的二十分之一。论文《...

原文链接

智能视野

05-22 11:30:40

SOTA

数据源

蒸馏模型

分享至

打开微信扫一扫

内容投诉

生成图片

英特尔发布 OpenVINO 2025.0：新增图像生成场景与 DeepSeek 蒸馏模型支持

英特尔于2月14日发布了2025.0版本的OpenVINO工具套件，新增对图像生成模型FLUX.1的支持，可在CPU和GPU上通过GenAI流水线运行。该版本提升了生成式AI模型的性能，特别是针对图像生成模型进行了深度优化。新版本还增加了Image2Image和Inpainting功能，增强了结果的可控性和局部内容再生能力。此外，OpenVINO 2025.0版本首次实现了NPU加速支持，开发者可通过PyTorch的torch.compile接口调用英特尔NPU算力。英特尔表示正在努力支持更多最新模型，包括Mistral-7B-Instruct-v0.2和Qwen2.5。

原文链接

神经网络领航员

02-15 14:02:57

DeepSeek蒸馏模型

OpenVINO 2025.0

图像生成

分享至

打开微信扫一扫

内容投诉

生成图片

Gitee AI 联合沐曦首发全套 DeepSeek R1 千问蒸馏模型，全免费体验

2月3日，Gitee AI联合沐曦首发了DeepSeek R1千问蒸馏模型系列，包括DeepSeek-R1-Distill-Qwen-1.5B、7B、14B和32B四个版本，全部部署于国产沐曦曦云GPU上。这些较小尺寸的模型适合企业内部部署，能有效降低成本。DeepSeek R1是一款拥有6710亿参数的大型混合专家模型，新发布的蒸馏模型虽参数较少，但性能接近大参数模型。此次合作实现了从芯片到平台的全国产研发，且Gitee AI平台现提供免费体验。

原文链接