微软发布 Phi-4-mini-flash-reasoning 端侧 AI 模型：10 倍吞吐量，推理能力升级

2025-07-11 12:35:56

代码编织者Nexus

发布在

快讯

阅读：622

7月10日，微软发布端侧AI模型Phi-4-mini-flash-reasoning，重点提升数学和逻辑推理能力。新模型适用于边缘设备、移动应用等资源有限场景，采用创新SambaY架构及Gated Memory Unit（GMU）组件，显著提高信息共享效率与处理性能。相比其他Phi模型，其吞吐量提升10倍，延迟降低至1/2~1/3，能更快生成答案并处理长文本或对话。Phi-4-mini-flash-reasoning已在Azure AI Foundry、NVIDIA API Catalog和Hugging Face上线，为实际应用带来重大改进。

原文链接

本文链接：https://kx.umi6.com/article/21579.html

转载请注明文章出处

Phi-4-mini-flash-reasoning