1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

全球首个端侧全模态理解开源模型来了!这个模型名为Megrez-3B-Omni,具有多项优势。它能轻松处理图片、音频、文本三种模态数据,且体积轻巧,速度飞快。

在图像理解方面,Megrez-3B-Omni作为3B模型,其综合性能表现超过34B的大模型。它在多个主流测试集上精度最高,能够准确理解和分析图像内容,包括复杂的文字识别。

在文本理解方面,Megrez-3B-Omni将上一代14B模型的能力压缩到3B规模,显著降低了计算成本,提升了计算效率。在多个权威测试集上,它取得了端上模型最优精度,为端侧设备的智能化提供了新的可能。

在语音理解方面,Megrez-3B-Omni支持中文和英文的语音输入,处理复杂的多轮对话场景。用户可以通过语音指令与模型互动,实现语音与文本输入的自由切换。

此外,Megrez-3B-Omni在推理速度上也表现出色,最大推理速度比同精度模型快300%。它还提供WebSearch功能,智能判断何时调用外部工具进行搜索,以提高回答的准确性。

无问芯穹技术团队来自清华大学,他们在模型压缩、推理加速及硬件能耗优化等方面拥有深厚经验。Megrez-3B-Omni是他们推出的一个能力预览,未来将继续迭代Megrez系列,提升自动化水平,使端设备的操作更加简便。

该模型已在GitHub和HuggingFace上开源,欢迎访问体验。

Github: https://github.com/infinigence/Infini-Megrez
HuggingFace: https://huggingface.co/Infinigence/Megrez-3B-Omni
体验纯语言版本Megrez-3B-Instruct: https://cloud.infini-ai.com/genstudio/model/mo-c73owqiotql7lozr

原文链接
本文链接:https://kx.umi6.com/article/10258.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
最强3B「小钢炮」,代码数据全公开!推理随意开关,128k超长上下文
2025-07-11 11:34:58
小米具身大模型 MiMo-Embodied 发布并全面开源,业界首个打通自动驾驶与具身智能
2025-11-21 18:38:45
机器人线下真机对线打PK!这届黑客松可太会玩了
2026-03-31 14:52:20
腾讯混元 0.5B、1.8B、4B、7B模型发布
2025-08-04 16:02:12
阿里达摩院首次开源具身智能“三大件”机器人上下文协议
2025-08-11 13:01:00
开源“裸考”真实世界,国产具身智能基座模型拿下全球第二!
2026-01-08 19:25:43
最强Coding Plan上线!阿里云上线Qwen3.5、GLM-5、MiniMax M2.5、Kimi K2.5四大顶尖开源模型
2026-02-25 13:16:58
千问3.5登顶Hugging Face,前十开源模型中国占据8席
2026-02-24 15:53:18
爆火全网FLUX.2重磅上线,开源版Nano Banana来了!
2025-11-26 17:55:27
出圈一周年,DeepSeek的变与不变
2026-01-16 15:50:22
刚刚,OpenAI开源2个推理模型:笔记本/手机就能跑,性能接近o4-mini
2025-08-06 06:22:19
蚂蚁集团发布万亿参数旗舰模型 Ling-1T 并开源,多项指标位居开源模型榜首
2025-10-11 09:36:05
华为盘古718B模型最新成绩:开源第二
2025-09-29 13:08:42
24小时热文
更多
扫一扫体验小程序