1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

昨晚,DeepSeek创始人梁文峰回到广州过年,但在除夕夜前夕,他们发布了新模型Janus-Pro。这使DeepSeek再次成为焦点。Janus-Pro是一款多模态理解和生成模型,升级自Janus模型,能同时处理文本和图像。它被称为雅努斯,源于罗马神话中双面守护神的形象,象征开始和结束。

Janus-Pro为何推出?尽管现有模型已强大,但仍存在处理复杂任务时的不足。Janus-Pro采用解耦视觉编码的设计,分为理解图像和生成图像两部分。理解图像时,使用SigLIP编码器提取特征;生成图像时,则通过VQ tokenizer生成代码,再由适配器转换为机器语言。

训练Janus-Pro分三阶段:基础训练、增强训练、最终微调。训练过程中,加入大量图像字幕数据、表格图表及合成美学数据,提升模型的多模态理解和生成能力。模型规模也从1.5B扩展至7B,参数优化显著提升了性能。

Janus-Pro的实际表现优异,在多模态理解和视觉生成任务上均超过其他知名模型。如在MMBench基准测试中得分79.2,高于TokenFlow-XL和MetaMorph。在GenEval测试中得分0.80,超越DALL-E 3和Stable Diffusion 3 Medium。

原文链接
本文链接:https://kx.umi6.com/article/12302.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
DeepSeek 开源新模型 V3.1:约 685B 参数,上下文长度拓展至 128K
2025-08-20 10:11:16
DeepSeek 出现服务故障:网页 / API 性能异常,已进行修复
2025-11-25 16:59:50
被曝蒸馏DeepSeek还造假!欧版OpenAI塌方了
2025-08-14 16:57:45
独家丨前阿里通义视觉负责人薄列峰,已加入腾讯混元团队
2025-07-27 19:02:28
DeepSeek发布梁文锋署名新论文 开源相关记忆模块Engram
2026-01-13 09:25:44
QuestMobile 报告:豆包月活超越 DeepSeek,夺 8 月中国原生 AI App 月活第一
2025-09-16 18:17:35
网友称“Deepseek演都不演了”:输入手机内存不够“二选一删谁” 秒回答豆包
2025-08-20 17:26:16
DeepSeek新大招曝光:下一步智能体
2025-09-05 10:15:28
DeepSeek发布两款新模型
2025-12-01 19:31:03
DeepSeek 开年发布新论文:提出全新 mHC 架构,梁文锋现身作者名单
2026-01-01 17:23:53
DeepSeek 通知线上模型版本升级至 V3.1,上下文长度拓展至 128k
2025-08-19 21:05:45
梁文锋,准备战斗
2025-07-30 17:51:33
六大AI拿1万美元真实交易:DeepSeek最能赚,GPT-5亏麻了,AI能让周杰伦少亏上亿
2025-10-20 17:12:32
24小时热文
更多
扫一扫体验小程序