2025-07-11 12:35:56
微软发布 Phi-4-mini-flash-reasoning 端侧 AI 模型:10 倍吞吐量,推理能力升级
阅读:132
7月10日,微软发布端侧AI模型Phi-4-mini-flash-reasoning,重点提升数学和逻辑推理能力。新模型适用于边缘设备、移动应用等资源有限场景,采用创新SambaY架构及Gated Memory Unit(GMU)组件,显著提高信息共享效率与处理性能。相比其他Phi模型,其吞吐量提升10倍,延迟降低至1/2~1/3,能更快生成答案并处理长文本或对话。Phi-4-mini-flash-reasoning已在Azure AI Foundry、NVIDIA API Catalog和Hugging Face上线,为实际应用带来重大改进。
原文链接
本文链接:https://kx.umi6.com/article/21579.html
转载请注明文章出处
相关推荐
.png)
换一换
当大模型升级速度变缓,AI Infra 创业还是一门「好生意」吗?
2024-11-09 20:56:00
AI医疗,火爆出圈
2025-02-15 11:00:48
独家|华为诺亚方舟实验室主任换帅,90 后王云鹤接班姚骏
2025-03-31 16:40:53
457 文章
79849 浏览
24小时热文
更多

-
2025-07-18 23:46:25
-
2025-07-18 22:47:06
-
2025-07-18 22:46:21