综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2025年10月,百度蒸汽机模型推出重大升级,率先实现AI视频的实时流式生成与交互功能。用户只需上传一张图片和简单指令,即可生成高质量长视频,并支持随时暂停、修改与续写,打破传统生成时长限制。此次更新采用自回归扩散模型等技术,解决了生成效率与成本问题,推理延迟几乎实时。从5月登顶VBench-I2V榜单,到10月迈入实时交互时代,百度蒸汽机在短短5个月内完成了从图生视频到音画一体生成的技术演进。新功能不仅降低创作门槛,还推动AI视频能力向教育、影视等领域扩展,标志着AI内容创作从单向输出转向共创时代。
原文链接
10月15日,百度宣布其视频生成模型“百度蒸汽机”(文心专精)完成重大升级。此次升级突破了传统AI视频生成时长限制,行业首次实现AI长视频实时交互生成,生成速度超越国内主流模型。用户只需上传单张图片与提示词即可启动视频生成,并实时预览全部推理内容。在生成过程中,用户可随时暂停或修改提示词,动态调整视频剧情、画面及转场效果,实现全程干预。这一创新技术为视频创作提供了更高自由度和效率,展现了AI在长视频领域的全新可能性。
原文链接
9月25日,百度蒸汽机发布全球首个中文音视频一体化模型的通用AI长视频生成功能。该功能突破以往AI仅能生成短视频或依赖首尾帧续写的限制,支持用户生成无限长度的AI视频,并引入“流式无限生成”技术,首次实现通用长视频的‘无限’生成能力。这一升级为行业首创,带来更灵活的视频创作体验。
原文链接
9月25日,百度蒸汽机发布通用AI长视频生成功能,首次突破行业长度限制,支持生成无限长度的AI视频。此次升级通过流式生成技术,解决了以往仅能生成5秒、10秒短视频或依赖首尾帧续写的局限。此前,百度蒸汽机音视频一体化模型在上个月完成2.0版本升级,实现多人有声视频一体化生成,并具备复杂运镜、电影级细腻表演和流畅画质等特性。新功能进一步巩固了其在音视频生成领域的领先地位,为用户提供更强大、灵活的创作工具。
原文链接
2025年8月,百度推出蒸汽机2.0视频生成大模型,主打多人有声音视频一体化生成。新版本擅长复杂运镜、电影级画质和精准中文语音对齐,并首创多模态潜在空间规划技术。用户可通过百度搜索“百度蒸汽机”或绘想平台体验,企业用户可在百度千帆大模型平台调用API服务。价格低至行业70%,限时优惠1.4元/5秒。发布会现场展示了多样化的应用场景,如科幻短片、品牌营销视频等,影视视效专家姚骐称其让好莱坞级镜头制作成本大幅降低。目前,该模型已在百度移动生态广泛落地,支持搜索、内容创作及商业营销等场景。
原文链接
8月21日,百度蒸汽机2.0版上线,首次实现多人有声视频一体化生成。该模型基于多模态时空规划、中文场景优化及音视端到端建模技术,支持复杂运镜、细腻人物表演及流畅画质。用户可通过百度搜索“百度蒸汽机”或登录“绘想”平台体验,企业用户可在千帆平台获取高性能服务。此外,百度于8月19日发布声明,提醒用户警惕海外出现的虚假网站,避免受骗。
原文链接
8月19日,百度营销发布声明称,近期海外出现大量关于百度视频生成模型‘蒸汽机(MuseSteamer)’的虚假网站,提醒用户注意甄别,谨防受骗。百度蒸汽机于7月2日发布,首日平均每分钟超百人申请,2周内注册用户超30万。据悉,该产品将于8月21日举办升级发布会,推出2.0版本,包括Turbo、Lite、Pro和有声版全系模型。新版基于多模态时空规划、中文场景优化及音视端到端建模技术,支持多人音视频一体化生成、复杂运镜、电影级表演等功能,画质更流畅细腻。
原文链接
加载更多
暂无内容