1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

昨晚,DeepSeek创始人梁文峰回到广州过年,但在除夕夜前夕,他们发布了新模型Janus-Pro。这使DeepSeek再次成为焦点。Janus-Pro是一款多模态理解和生成模型,升级自Janus模型,能同时处理文本和图像。它被称为雅努斯,源于罗马神话中双面守护神的形象,象征开始和结束。

Janus-Pro为何推出?尽管现有模型已强大,但仍存在处理复杂任务时的不足。Janus-Pro采用解耦视觉编码的设计,分为理解图像和生成图像两部分。理解图像时,使用SigLIP编码器提取特征;生成图像时,则通过VQ tokenizer生成代码,再由适配器转换为机器语言。

训练Janus-Pro分三阶段:基础训练、增强训练、最终微调。训练过程中,加入大量图像字幕数据、表格图表及合成美学数据,提升模型的多模态理解和生成能力。模型规模也从1.5B扩展至7B,参数优化显著提升了性能。

Janus-Pro的实际表现优异,在多模态理解和视觉生成任务上均超过其他知名模型。如在MMBench基准测试中得分79.2,高于TokenFlow-XL和MetaMorph。在GenEval测试中得分0.80,超越DALL-E 3和Stable Diffusion 3 Medium。

原文链接
本文链接:https://kx.umi6.com/article/12302.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
DeepSeek V3.1突现离谱Bug:“极”字满屏乱蹦,开发者一脸懵逼
2025-08-26 14:46:26
国产开源模型强势追击!DeepSeek与OpenAI最新模型实测对决
2025-05-29 16:40:22
DeepSeek:已在平台内对 AI 生成合成内容添加标识,用户不得恶意删除
2025-09-01 18:24:35
ColorOS 小布助手月活量达 1.5 亿,OPPO 手机(含一加)接入 DeepSeek 设备量行业第一
2025-06-10 15:49:36
DeepSeek一句话让国产芯片集体暴涨!背后的UE8M0 FP8到底是个啥
2025-08-22 14:48:58
俩人拼出40万的Mac Studio“缝合怪”,双开满血DeepSeek 都不在话下
2025-08-09 11:28:33
黄仁勋谈中国AI创新:以令人难以置信的速度前进
2025-07-16 17:12:34
DeepSeek对“王一博案”道歉?假新闻!
2025-07-03 23:32:06
拯救P图废柴,阿里上新多模态模型Qwen-VLo!人人免费可玩
2025-06-28 13:21:34
独家丨前阿里通义视觉负责人薄列峰,已加入腾讯混元团队
2025-07-27 19:02:28
DeepSeek新版R1直追OpenAI o3!实测来了:“小版本升级”着实不小
2025-05-29 11:14:38
黄仁勋力赞 DeepSeek,称中国创新的步伐不可能被阻挡
2025-07-21 09:13:49
多模态新旗舰MiniCPM-V 4.5:8B 性能超越 72B,高刷视频理解又准又快
2025-08-27 12:03:30
24小时热文
更多
扫一扫体验小程序