12月16日,无问芯穹宣布开源全球首款端侧全模态理解模型Megrez-3B-Omni,该模型能处理图像、音频、文本三种模态数据。在图像理解方面,它在多个主流测试集中表现优异;在文本理解方面,它在多个权威测试集中达到最优精度;在语音理解方面,支持中英语音输入及复杂多轮对话。此外,其单模态版本Megrez-3B-Instruct在推理速度上比同类模型快300%。相关资源已上传至Github、HuggingFace等平台。
原文链接
本文链接:https://kx.umi6.com/article/10261.html
转载请注明文章出处
相关推荐
换一换
面壁智能发布 MiniCPM-o 2.6 全模态模型,号称“端侧 GPT-4o”
2025-01-16 19:00:56
无问芯穹开源全球首款端侧全模态理解模型 Megrez-3B-Omni,支持图像、音频、文本理解
2024-12-16 13:38:34
vivo发布端侧多模态模型,只有3B可理解GUI界面,20项评测表现亮眼
2025-07-10 17:25:30
大模型热度退潮,真正的技术创新者开始被「看见」
2025-06-20 17:06:44
茅台基金,投了“清华系”大模型企业
2025-05-25 07:56:07
热钱仍在涌入大模型圈
2024-12-11 18:35:00
东吴证券:Deepseek的底层创新最为重要 2025年或是端侧的爆发元年
2025-02-06 14:38:34
全球算力稀缺下,如何看待端侧 AI 设备投资前景?
2024-05-20 14:39:07
消息称 vivo OS 部门新成立 AI 领域,大模型训练重心向端侧转移
2025-03-05 09:55:26
头号重仓股易主 公募持续掘金AI主线
2026-01-23 06:34:26
xAI工程师播客聊太嗨,马斯克解雇了他
2026-01-21 18:20:58
昇腾云客户2663家,华为云稳居最大国产AI云服务提供商
2026-01-22 17:01:32
知名游戏女主播怒斥AI修图 花大手笔清除不雅照
2026-01-22 08:43:34
641 文章
416164 浏览
24小时热文
更多
-
2026-01-23 11:53:08 -
2026-01-23 11:52:03 -
2026-01-23 11:50:59