正文:2026年1月5日,华为开源全新多模态模型openPangu-VL-7B,专为端侧部署与个人开发者设计。该模型具备出色的视觉定位和OCR能力,在通用视觉问答、文档理解、短视频解析等任务中表现优异。其基于昇腾硬件优化,推理时延仅160毫秒,训练阶段MFU达42.5%,并在3T+tokens的无突刺长稳训练中展现高性能。核心技术包括适配昇腾的视觉编码器、样本均衡损失设计以及带填充的定位数据格式,显著提升效率与精度。模型已开源,为昇腾生态注入新动力。
原文链接
本文链接:https://kx.umi6.com/article/31120.html
转载请注明文章出处
相关推荐
换一换
天工大模型 4.0 o1 版 / 4o 版上线,App 及网页可免费使用
2025-01-06 11:23:41
行业首个:8B 参数面壁小钢炮 MiniCPM-V 4.5 开源,号称“最强端侧多模态模型”
2025-08-28 10:15:37
超越GPT-4o!阿里发布最强开源多模态模型Qwen2-VL,支持实时视频对话
2024-08-30 15:15:58
阶跃星辰推出开源 SOTA 图像编辑模型,一个月连发三款多模态模型
2025-04-27 15:20:13
3D打印火出圈了?一众网友秀“成果” 幕后推手竟是这款AI模型
2025-09-01 13:19:49
阿里云栖大会一口气发布千问 3-VL、万相 2.5 等六大模型 + 通义百聆新品牌,覆盖文本、视觉、语音、视频、代码、图像全场景
2025-09-24 14:42:04
DeepSeek 深夜再放大招:7B 参数人人可用的视觉多模态模型 Janus-Pro-7B 开源
2025-01-28 01:38:40
阿里通义千问宣布推出多模态模型 Qwen VLo,实现从感知到生成的跨越
2025-06-28 00:15:30
多模态模型学会“按需搜索”,少搜30%还更准!字节&NTU新研究优化多模态模型搜索策略
2025-07-09 14:06:26
全球最大开源视频模型,现在也Created in China了,阶跃出品
2025-02-18 13:15:12
41个榜单SOTA!智谱最新开源GLM-4.5V实测:看图猜地址、视频秒变代码
2025-08-12 16:19:29
实测Gemini 3 Pro - ,未来已来?
2025-11-19 10:08:03
比扩散模型快50倍!OpenAI发布多模态模型实时生成进展,作者还是清华校友,把休假总裁Greg都炸出来了
2024-10-24 14:09:29
654 文章
412865 浏览
24小时热文
更多
-
2026-01-06 21:27:28 -
2026-01-06 20:25:08 -
2026-01-06 19:33:53