综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
9月14日,Stability AI发布企业级音频生成模型Stable Audio 2.5,主打高效生成与细节优化。新模型可在2秒内生成3分钟的高质量音频曲目,采用ARC技术(相对式对抗训练与对比判别器)提升生成速度和音轨质量。其生成结果更贴合编曲逻辑,支持前奏、发展与结尾等多段式结构,并能准确响应情绪描述和音乐风格提示词。新增音频修补功能,可基于用户上传的音频文件智能延展内容,适合剪辑场景。目前,模型已开放官网试用并支持本地化部署,但禁止上传受版权保护的内容,平台将通过内容识别系统防止侵权行为。
原文链接
《科创板日报》29日消息,快手旗下可灵AI近日上线了全新2.1系列模型。该系列模型在标准模式(720p)下生成5秒视频仅需20灵感值,在高品质模式(1080p)下也只需35灵感值,有效满足了用户的成本控制需求。同时,2.1系列模型在生成效率上表现优异,高品质模式下生成5秒视频的时间不到1分钟。这一系列新功能的推出,为用户提供了更高效、更具性价比的视频生成体验。
原文链接
英伟达联合MIT和清华团队推出Sana架构,显著提升AI图像生成速度。一台16GB RTX 4090笔记本仅需0.37秒即可生成1024×1024像素高清图片,最高支持4K分辨率。Sana架构通过深度压缩自编码器、线性DiT和高效训练策略,实现100倍吞吐量提升,参数仅为FLUX-12B的1/12。该架构不仅速度快,还能生成高质量、高分辨率图像,并具备强文本-图像对齐能力。Sana的高效性能有望推动低成本内容创作的发展。相关论文和项目详情已发布在指定链接。
原文链接
加载更多
暂无内容