正文:2026年1月5日,华为开源全新多模态模型openPangu-VL-7B,专为端侧部署与个人开发者设计。该模型具备出色的视觉定位和OCR能力,在通用视觉问答、文档理解、短视频解析等任务中表现优异。其基于昇腾硬件优化,推理时延仅160毫秒,训练阶段MFU达42.5%,并在3T+tokens的无突刺长稳训练中展现高性能。核心技术包括适配昇腾的视觉编码器、样本均衡损失设计以及带填充的定位数据格式,显著提升效率与精度。模型已开源,为昇腾生态注入新动力。
原文链接
本文链接:https://kx.umi6.com/article/31120.html
转载请注明文章出处
相关推荐
换一换
浙大团队破解多模态模型「盲目自信」:先校准置信度,再分配算力丨CVPR’26
2026-03-22 15:55:17
全球最大开源视频模型,现在也Created in China了,阶跃出品
2025-02-18 13:15:12
多模态模型挑战北京杭州地铁图!o3成绩显著,但跟人类有差距
2025-06-07 13:49:19
阶跃生态开放日:聚焦智能终端 Agent,率先布局端侧全产业
2025-02-25 17:06:04
谷歌年度大招:所有AI模型全升级一遍!Gemini2.5大杯中杯霸榜前二,新版视频/图像模型亮相
2025-05-21 05:52:42
实测商汤实时音视频交互模型5o:“造假”齐白石《虾》一眼识破!
2025-01-23 16:19:50
阶跃星辰推出开源 SOTA 图像编辑模型,一个月连发三款多模态模型
2025-04-27 15:20:13
32B本地部署!阿里开源最新多模态模型:主打视觉语言,数学推理也很强
2025-03-25 09:39:46
智谱联合华为开源首个国产芯片训练的多模态SOTA模型
2026-01-14 09:24:34
3D打印火出圈了?一众网友秀“成果” 幕后推手竟是这款AI模型
2025-09-01 13:19:49
模型“看视频写网页”,GPT-5仅36.35分!首个video2code基准发布
2025-10-19 15:51:15
天工大模型 4.0 o1 版 / 4o 版上线,App 及网页可免费使用
2025-01-06 11:23:41
上科大何旭明团队新作:克服简单样本偏置,让多模态模型学会「难题优先」
2026-01-16 15:56:29
735 文章
583689 浏览
24小时热文
更多
-
2026-04-24 16:22:09 -
2026-04-24 16:21:03 -
2026-04-24 16:19:57