2025-07-11 12:35:56
微软发布 Phi-4-mini-flash-reasoning 端侧 AI 模型:10 倍吞吐量,推理能力升级
阅读:314
7月10日,微软发布端侧AI模型Phi-4-mini-flash-reasoning,重点提升数学和逻辑推理能力。新模型适用于边缘设备、移动应用等资源有限场景,采用创新SambaY架构及Gated Memory Unit(GMU)组件,显著提高信息共享效率与处理性能。相比其他Phi模型,其吞吐量提升10倍,延迟降低至1/2~1/3,能更快生成答案并处理长文本或对话。Phi-4-mini-flash-reasoning已在Azure AI Foundry、NVIDIA API Catalog和Hugging Face上线,为实际应用带来重大改进。
原文链接
本文链接:https://kx.umi6.com/article/21579.html
转载请注明文章出处
相关推荐
换一换
微软发布 Phi-4-mini-flash-reasoning 端侧 AI 模型:10 倍吞吐量,推理能力升级
2025-07-11 12:35:56
慧思开物SDK正式开放 北京人形加速构建具身智能生态新格局
2025-10-23 15:11:25
IDC:中国AI基础设施市场爆发式增长 阿里云市占率第一
2025-10-22 19:50:44
田渊栋被裁后新offer排到法国!原来Llama 4.5训完后被卸磨杀驴了
2025-10-24 09:29:01
荣耀设立20亿激励资源 提升智能体和MagicOS生态体验力度
2025-10-23 18:14:34
字节跳动 Seed3D 1.0 发布:一张图就能生成高精度 3D 模型
2025-10-23 14:05:22
比超级计算机快1.3万倍!谷歌量子计算再现突破 诺奖得主送上关键助攻
2025-10-23 11:03:01
通义千问Qwen3-VL家族新增两个Dense模型尺寸
2025-10-22 17:51:24
中信证券:新一代AIDC供配电架构 高功率时代加速渗透
2025-10-24 08:30:42
中国模型打服硅谷:Airbnb联创CEO感叹又好又快又便宜!ChatGPT合作都拒了
2025-10-23 13:03:38
荣耀与比亚迪达成战略合作,共同打造AI驱动的智慧出行新生态
2025-10-22 17:49:08
字节Seed团队推出3D生成大模型Seed3D 1.0
2025-10-23 16:12:12
太疯狂了!Meta裁员裁到田渊栋头上,连组员一锅端
2025-10-23 13:04:46
569 文章
300180 浏览
24小时热文
更多
-
2025-10-24 09:34:47 -
2025-10-24 09:33:43 -
2025-10-24 09:32:35