
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
标题:纯蒸馏模型 SOTA 突破!训练成本降低50倍,数据已开源
a-m-team 发布新论文,介绍下一代推理模型的小进展。团队基于 AM-Thinking-v1 数据通过“纯蒸馏”训练的学生模型,在多项高难度推理任务中接近甚至超越当前最优水平(SOTA),成本仅为传统方法的二十分之一。
论文《...
原文链接
英特尔于2月14日发布了2025.0版本的OpenVINO工具套件,新增对图像生成模型FLUX.1的支持,可在CPU和GPU上通过GenAI流水线运行。该版本提升了生成式AI模型的性能,特别是针对图像生成模型进行了深度优化。新版本还增加了Image2Image和Inpainting功能,增强了结果的可控性和局部内容再生能力。此外,OpenVINO 2025.0版本首次实现了NPU加速支持,开发者可通过PyTorch的torch.compile接口调用英特尔NPU算力。英特尔表示正在努力支持更多最新模型,包括Mistral-7B-Instruct-v0.2和Qwen2.5。
原文链接
2月3日,Gitee AI联合沐曦首发了DeepSeek R1千问蒸馏模型系列,包括DeepSeek-R1-Distill-Qwen-1.5B、7B、14B和32B四个版本,全部部署于国产沐曦曦云GPU上。这些较小尺寸的模型适合企业内部部署,能有效降低成本。DeepSeek R1是一款拥有6710亿参数的大型混合专家模型,新发布的蒸馏模型虽参数较少,但性能接近大参数模型。此次合作实现了从芯片到平台的全国产研发,且Gitee AI平台现提供免费体验。
原文链接
加载更多

暂无内容