微软于2024年12月发布Phi-4小型语言模型后,近日又推出了两款新模型:Phi-4多模态和Phi-4迷你。Phi-4多模态是微软首款集成了语音、视觉和文本处理的统一架构多模态语言模型,参数量达56亿,在多项基准测试中表现优异,尤其是在语音识别和视觉推理方面超越了现有模型。Phi-4迷你模型专注于文本任务,参数量为38亿,在文本推理、数学计算等方面表现出色。新模型已通过ONNX Runtime部署到设备端,适用于低成本和低延迟场景。目前,这两款新模型已在Azure AI Foundry、Hugging Face和NVIDIA API目录中上线。
原文链接
本文链接:https://kx.umi6.com/article/14429.html
转载请注明文章出处
相关推荐
换一换
商汤坐上大模型核心牌桌
2025-05-09 11:48:13
字节把GPT-4o级图像生成能力开源了!
2025-05-24 16:24:01
2024年AI“洋模型”大起底
2024-12-27 15:04:14
字节 Seed 开源统一多模态理解和生成模型 BAGEL
2025-06-03 19:01:17
微软开源多模态 AI Agent“Magma”:购物时可自动下单,还能推测视频人物行为
2025-02-26 10:28:10
GPT-5信息大量泄露,四个版本全曝光,免费用户也能用,还有一个神秘功能
2025-08-07 18:55:45
GPT-5泄露!首次统一GPT和o系列,实测demo抢先曝光,下周发布?
2025-08-01 08:52:52
智源研究院发布“悟界”系列大模型,含全球首个原生多模态世界模型 Emu3
2025-06-06 12:30:15
独家|智元机器人:正与阶跃星辰合作 将多模态能力赋能至机器人
2025-03-10 12:37:14
从Figma到中国垂类应用全球崛起
2025-08-01 14:01:49
阶跃星辰再拿多模态榜首,全方位升级发布六款模型
2025-01-22 18:02:08
北大等发布多模态版o1!首个慢思考VLM将开源,视觉推理超闭源
2024-11-19 14:45:41
7B模型搞定AI视频通话,阿里最新开源炸场,看听说写全模态打通,开发者企业免费商用
2025-03-27 13:46:24
524 文章
241188 浏览
24小时热文
更多
-
2025-10-24 09:34:47 -
2025-10-24 09:33:43 -
2025-10-24 09:32:35