微软于2024年12月发布Phi-4小型语言模型后,近日又推出了两款新模型:Phi-4多模态和Phi-4迷你。Phi-4多模态是微软首款集成了语音、视觉和文本处理的统一架构多模态语言模型,参数量达56亿,在多项基准测试中表现优异,尤其是在语音识别和视觉推理方面超越了现有模型。Phi-4迷你模型专注于文本任务,参数量为38亿,在文本推理、数学计算等方面表现出色。新模型已通过ONNX Runtime部署到设备端,适用于低成本和低延迟场景。目前,这两款新模型已在Azure AI Foundry、Hugging Face和NVIDIA API目录中上线。
原文链接
本文链接:https://kx.umi6.com/article/14429.html
转载请注明文章出处
相关推荐
.png)
换一换
智源发布原生多模态世界模型 Emu3,宣称实现图像、文本、视频大一统
2024-10-22 00:42:45
百度:推出首个多模态高度融合数字人
2025-06-17 16:25:35
豆包大模型1.6正式发布
2025-06-11 11:12:11
426 文章
66281 浏览
24小时热文
更多

-
2025-07-20 23:09:27
-
2025-07-20 22:09:17
-
2025-07-20 21:10:03