实时生成 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

Karpathy都投的AI实时视频生成模型：直播立即转，无限时长零延迟

正文：2025年7月19日，美国加州初创公司Decart推出实时AI视频生成模型MirageLSD，获AI大神Karpathy投资。该模型基于自研Live-Stream Diffusion（LSD）技术，攻克了传统自回归视频生成中“误差累积”难题，实现零延迟、无限时长的实时视频生成，延迟降至40毫秒以下，速度比现有模型快16倍，支持每秒24帧输出。MirageLSD支持直播、游戏、视频通话等多种输入形式，并允许实时提示与编辑。其创新点包括因果自回归结构、Diffusion Forcing技术和历史增强策略，确保生成连贯性与高质量。Decart此前于2024年发布首款模型Oasis，具备零延迟开放世界生成能力。团队计划未来升级面部一致性、语音控制等功能，进一步提升用户体验。

原文链接

智能视野

07-19 14:53:50

分享至

打开微信扫一扫

内容投诉

生成图片

鹅厂放大招，混元图像2.0「边说边画」：描述完，图也生成好了

腾讯旗下混元图像2.0（Hunyuan Image 2.0）发布，实现毫秒级响应的“边说边画”实时文生图功能。用户可通过文字描述或语音输入生成图像，支持参考图特征提取及画面优化。此外，新增实时绘画板模式，结合手绘草图与文本描述生成图像。技术亮点包括更大模型参数、自研高压缩比图像编解码器、适配多模态大语言模型作为文本编码器，以及强化学习后训练提升生成真实感。该模型在语义匹配能力测试中表现优异，官网已开放测试资格。腾讯混元团队还预告即将推出原生多模态图像生成大模型。

原文链接

量子黑客

05-16 17:18:33

分享至

打开微信扫一扫

内容投诉

生成图片

“千人千面”的广告时代将被AI终结

标题：“千人千面”的广告时代将被AI终结 DeepSeek的爆火不仅引发了社会对AI的大讨论，还推动各界从观望转向实践，掀起人工智能落地潮。作为互联网核心商业模式的广告，成为AI技术应用的主要战场。搜索-推荐-广告构成了互联网核心技术栈，为AI提供了海量数据、强大的模型训练平台及落地场景。...

原文链接

智能涌动

03-31 18:45:00

分享至

打开微信扫一扫

内容投诉

生成图片

比扩散模型快50倍！OpenAI发布多模态模型实时生成进展，作者还是清华校友，把休假总裁Greg都炸出来了

标题：比扩散模型快50倍！OpenAI发布多模态模型实时生成进展，作者还是清华校友，把休假总裁Greg都炸出来了正文：两位清华校友在OpenAI发布了最新研究——生成图像的速度比扩散模型快50倍。路橙和宋飏简化了一致性模型，仅用两步采样就使生成质量与扩散模型相媲美。他们将连续时间一致性模型的训...

原文链接