1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

昨晚,DeepSeek创始人梁文峰回到广州过年,但在除夕夜前夕,他们发布了新模型Janus-Pro。这使DeepSeek再次成为焦点。Janus-Pro是一款多模态理解和生成模型,升级自Janus模型,能同时处理文本和图像。它被称为雅努斯,源于罗马神话中双面守护神的形象,象征开始和结束。

Janus-Pro为何推出?尽管现有模型已强大,但仍存在处理复杂任务时的不足。Janus-Pro采用解耦视觉编码的设计,分为理解图像和生成图像两部分。理解图像时,使用SigLIP编码器提取特征;生成图像时,则通过VQ tokenizer生成代码,再由适配器转换为机器语言。

训练Janus-Pro分三阶段:基础训练、增强训练、最终微调。训练过程中,加入大量图像字幕数据、表格图表及合成美学数据,提升模型的多模态理解和生成能力。模型规模也从1.5B扩展至7B,参数优化显著提升了性能。

Janus-Pro的实际表现优异,在多模态理解和视觉生成任务上均超过其他知名模型。如在MMBench基准测试中得分79.2,高于TokenFlow-XL和MetaMorph。在GenEval测试中得分0.80,超越DALL-E 3和Stable Diffusion 3 Medium。

原文链接
本文链接:https://kx.umi6.com/article/12302.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
第一批用DeepSeek推荐的人,已上当
2025-04-18 13:12:51
对话阶跃星辰CEO姜大昕:两年发布16款多模态模型,DeepSeek证明投流模式不成立
2025-05-08 16:31:26
朱民:未来18个月 中国将出现超百项“DeepSeek式突破”
2025-06-26 17:25:26
郑州:深化与DeepSeek等人工智能头部企业的合作
2025-06-24 20:22:15
百度李彦宏:如果没有应用,DeepSeek等 AI 模型和芯片都没有价值
2025-04-25 12:07:38
为什么日本出不来DeepSeek?
2025-04-24 11:32:28
DeepSeek开源新版R1 媲美OpenAI最高o3模型
2025-05-29 05:51:14
腾讯在AI上做对了什么?有哪些困境?
2025-05-27 09:15:32
DeepSeek降本秘诀曝光:2招极致压榨推理部署,算力全留给内部
2025-07-04 15:46:17
阶跃星辰推出开源 SOTA 图像编辑模型,一个月连发三款多模态模型
2025-04-27 15:20:13
人民呼唤DeepSeek!
2025-07-16 12:02:16
vivo发布端侧多模态模型,只有3B可理解GUI界面,20项评测表现亮眼
2025-07-10 17:25:30
好险,差点被DeepSeek幻觉害死
2025-07-09 15:08:10
24小时热文
更多
扫一扫体验小程序