12月16日,无问芯穹宣布开源全球首款端侧全模态理解模型Megrez-3B-Omni,该模型能处理图像、音频、文本三种模态数据。在图像理解方面,它在多个主流测试集中表现优异;在文本理解方面,它在多个权威测试集中达到最优精度;在语音理解方面,支持中英语音输入及复杂多轮对话。此外,其单模态版本Megrez-3B-Instruct在推理速度上比同类模型快300%。相关资源已上传至Github、HuggingFace等平台。
原文链接
本文链接:https://kx.umi6.com/article/10261.html
转载请注明文章出处
相关推荐
.png)
换一换
消息称 vivo OS 部门新成立 AI 领域,大模型训练重心向端侧转移
2025-03-05 09:55:26
全球算力稀缺下,如何看待端侧 AI 设备投资前景?
2024-05-20 14:39:07
大模型热度退潮,真正的技术创新者开始被「看见」
2025-06-20 17:06:44
450 文章
69531 浏览
24小时热文
更多

-
2025-07-21 12:18:20
-
2025-07-21 12:17:10
-
2025-07-21 11:21:54