
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
Stability AI 近日发布开源文生图模型Stable Diffusion 3.5,共提供Medium(10月29日发布)、Large和Large Turbo三种规模版本,以满足不同用户需求。其中,Large版本拥有80亿参数,专为专业场景设计;Turbo版本则是Large的简化版,优化了生成速度。Medium版本则具备25亿参数,采用MMDiT-X架构,预计10月29日上线,目标是在消费级硬件上实现“开箱即用”。尽管如此,Stability AI表示此次发布尚未完全达到预期,后续将继续优化。该系列模型均采用宽松社区许可,允许非商业用途免费使用,并对年收入低于100万美元的企业开放,超出门槛的企业需另行协商。
原文链接
标题:Stable Diffusion 3开源后快速遇尴尬,画人能力欠佳引发讨论
Stable Diffusion 3的最新开源版本在亮相不久后出现翻车,主要体现在生成人体相关的图像质量下滑,如草地躺的女孩示例存在明显失真。尽管局部细节如人脸表现优秀,整体写实性和人体结构理解却出现问题。这可能源于严格的成人内容过滤导致的模型训练数据受限。Stability AI公司在开源过程中遭遇内部动荡,包括CEO变动及团队离职,且面临财务危机。公司计划继续开源更大规模的模型,如4B和8B,但未来效果尚待观察。Stable Diffusion 3的开源过程一波三折,引发了关于技术与公司管理的热议。
原文链接
加载更多

暂无内容