
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
昨晚,DeepSeek创始人梁文峰回到广州过年,但在除夕夜前夕,他们发布了新模型Janus-Pro。这使DeepSeek再次成为焦点。Janus-Pro是一款多模态理解和生成模型,升级自Janus模型,能同时处理文本和图像。它被称为雅努斯,源于罗马神话中双面守护神的形象,象征开始和结束。
Janus...
原文链接
1月28日,人工智能社区Hugging Face显示,中国公司DeepSeek发布了开源多模态模型Janus-Pro,仅用128颗英伟达A100 GPU训练一周。Janus-Pro在多项基准测试中超越了OpenAI的DALL-E 3和Stable Diffusion,展现了卓越的多模态理解和生成能力。DeepSeek此举引发市场震动,1月27日英伟达股价暴跌17%,市值蒸发近6000亿美元。DeepSeek表示Janus-Pro的训练成本仅为数万美元,这一成就挑战了高端AI芯片的需求,引发行业对AI技术发展路径的重新思考。
原文链接
财联社1月28日电,DeepSeek近日发布了开源多模态AI模型Janus-Pro。该模型Janus-Pro-7B在GenEval和DPG-Bench基准测试中表现优异,超越了OpenAI的DALL-E 3及Stable Diffusion。
原文链接
北京时间1月28日凌晨,DeepSeek宣布开源全新视觉多模态模型Janus-Pro-7B。该模型在GenEval和DPG-Bench基准测试中击败了Stable Diffusion和OpenAI的DALL-E 3。Janus-Pro通过将视觉编码过程拆分为多个独立路径,解决了以往框架中的局限性,提升了灵活性。Janus-Pro是基于DeepSeek-LLM-7b-base构建的,支持384x384像素的图像输入。模型在多模态理解和文本到图像生成方面表现出色,提高了生成的稳定性和效率。GitHub和HuggingFace链接已提供。
原文链接
加载更多

暂无内容