综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
正文:2025年7月19日,美国加州初创公司Decart推出实时AI视频生成模型MirageLSD,获AI大神Karpathy投资。该模型基于自研Live-Stream Diffusion(LSD)技术,攻克了传统自回归视频生成中“误差累积”难题,实现零延迟、无限时长的实时视频生成,延迟降至40毫秒以下,速度比现有模型快16倍,支持每秒24帧输出。MirageLSD支持直播、游戏、视频通话等多种输入形式,并允许实时提示与编辑。其创新点包括因果自回归结构、Diffusion Forcing技术和历史增强策略,确保生成连贯性与高质量。Decart此前于2024年发布首款模型Oasis,具备零延迟开放世界生成能力。团队计划未来升级面部一致性、语音控制等功能,进一步提升用户体验。
原文链接
腾讯旗下混元图像2.0(Hunyuan Image 2.0)发布,实现毫秒级响应的“边说边画”实时文生图功能。用户可通过文字描述或语音输入生成图像,支持参考图特征提取及画面优化。此外,新增实时绘画板模式,结合手绘草图与文本描述生成图像。技术亮点包括更大模型参数、自研高压缩比图像编解码器、适配多模态大语言模型作为文本编码器,以及强化学习后训练提升生成真实感。该模型在语义匹配能力测试中表现优异,官网已开放测试资格。腾讯混元团队还预告即将推出原生多模态图像生成大模型。
原文链接
标题:“千人千面”的广告时代将被AI终结
DeepSeek的爆火不仅引发了社会对AI的大讨论,还推动各界从观望转向实践,掀起人工智能落地潮。作为互联网核心商业模式的广告,成为AI技术应用的主要战场。
搜索-推荐-广告构成了互联网核心技术栈,为AI提供了海量数据、强大的模型训练平台及落地场景。...
原文链接
标题:比扩散模型快50倍!OpenAI发布多模态模型实时生成进展,作者还是清华校友,把休假总裁Greg都炸出来了
正文:
两位清华校友在OpenAI发布了最新研究——生成图像的速度比扩散模型快50倍。
路橙和宋飏简化了一致性模型,仅用两步采样就使生成质量与扩散模型相媲美。他们将连续时间一致性模型的训...
原文链接
加载更多
暂无内容