视频生成 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

CVPR 2026 世界模型论文全景梳理：从生成到建模的关键转变

标题：CVPR 2026 世界模型论文全景梳理：从生成到建模的关键转变正文：近年来，视频生成技术在视觉质量上取得了显著进展，但传统方法多基于2D图像空间逐帧建模，存在相机运动控制难、多物体交互不一致等问题。这些问题的根源在于模型缺乏对“世界本身”的建模能力。在此背景下，“世界模型”逐渐成为研...

原文链接

电子诗篇

04-30 11:15:45

分享至

打开微信扫一扫

内容投诉

生成图片

MuleRun（骡子快跑）首发灰测HappyHorse模型，支持用户7×24小时调用

正文：4月27日，MuleRun（骡子快跑）首发灰测阿里巴巴视频生成模型HappyHorse 1.0，支持用户通过官网全天候调用。该模型具备文生视频、图生视频等能力，适用于广告、电商、短剧等场景。MuleRun为每位用户分配独立云端虚拟机，提供7×24小时服务，并主动学习用户偏好以优化体验。此外，HappyHorse 1.0支持15秒多镜头叙事、1080P输出及多种艺术风格还原。MuleRun还接入OpenAI的GPT-Image-2模型，支持一站式内容生产流程，包括图片处理、视频编辑等。用户可通过开放的Agent网络生态实现内容共享与共创。

原文链接

AI创意引擎

04-28 14:15:35

分享至

打开微信扫一扫

内容投诉

生成图片

千问首发灰测HappyHorse模型

4月27日，千问APP率先开启阿里视频模型HappyHorse的灰度测试，用户可通过首页‘HappyHorse’按钮体验。内测期间，创作者利用该模型生成大量TVB港风、央视三国风及老电影风格短片，并发布于千问APP社区，其他用户也可通过Prompt一键制作同款视频。根据官网信息，720P和1080P视频生成刊例价分别为0.9元/秒和1.6元/秒，专业会员包月叠加限时折扣后为0.44元/秒和0.78元/秒。（记者黄心怡）

原文链接

Journeyman

04-27 19:31:06

分享至

打开微信扫一扫

内容投诉

生成图片

西湖大学张驰团队：从视觉合成到空间理解，视频 AI 正在「转向」丨CVPR 2026

2026年4月，西湖大学AGI Lab张驰团队在CVPR 2026上发表论文《Taming Video Models for 3D and 4D Generation via Zero Shot Camera Control》，提出视频生成技术新方向。研究通过WorldForge模型，在不改变模型参数的情况下实现精确相机控制，解决了视角变化中几何一致性问题，将视频生成从二维视觉合成转向三维空间建模。实验显示，WorldForge在FID、CLIPsim等指标上显著优于现有方法，轨迹误差降低2到5倍，适用于3D静态场景与4D动态视频生成任务。该技术有望降低高质量视频制作门槛，赋能普通用户和创作者。研究团队由张驰教授领衔，一作宋晨曦为博士后研究员，成果入选CVPR Highlight，标志着视频AI从生成能力竞争迈向空间一致性与可控性竞争的关键转折点。

原文链接

新智燎原

04-22 15:15:46

分享至

打开微信扫一扫

内容投诉

生成图片

Seedance 2.0全面开放API服务

4月14日，火山引擎宣布正式上线Seedance 2.0系列API服务，全面开放视频生成能力。企业和个人用户现可调用该服务，支持文字、图片、音频、视频四种模态输入。据悉，Seedance 2.0特别建立了肖像与版权安全标准，覆盖视频生成涉及的多种模态及创作全流程，保障用户在使用中的合规性与安全性。这一升级服务为内容创作者和企业提供了更高效、灵活的视频生成解决方案，进一步推动多模态内容创作的发展。

原文链接

量子黑客

04-14 15:06:59

分享至

打开微信扫一扫

内容投诉

生成图片

下一代OpenClaw来了？“龙虾之父”称将率先支持阿里千问

4月7日，‘龙虾之父’彼得·斯坦伯格在社交媒体透露，下一代OpenClaw将新增视频生成功能，并率先支持阿里千问大模型。过去一周，阿里连续发布多款新模型，包括Qwen3.6-Plus、Qwen3.5-Omni等，覆盖编程、全模态、文生图等领域，在全球AI社区引发关注。其中，千问3.6Plus在OpenRouter平台霸榜多日，成为首个单日调用量突破1万亿Token的模型。此次合作或将推动OpenClaw与阿里千问的深度融合，为用户提供更强大的AI工具。

原文链接

月光编码师

04-07 12:53:34

分享至

打开微信扫一扫

内容投诉

生成图片

中山大学梁小丹团队论文：让视频生成从「看起来真实」到「物理上正确」丨CVPR 2026

标题：让视频生成从「看起来真实」到「物理上正确」正文：当前视频生成技术常因缺乏物理规律理解而显得不真实。例如，蜂蜜倒入茶中可能突然断裂，冰块融化直接消失，玻璃球入水瞬间静止。这些问题源于模型依赖数据驱动的模式匹配，而非模拟真实过程。四川大学雷印杰团队提出了一种新方法《Chain of ...

原文链接

量子思考者

03-30 14:53:39

分享至

打开微信扫一扫

内容投诉

生成图片

刚刚，全球视频模型新王诞生了！

2026年3月19日，天工AI发布全新视频模型SkyReels-V4，直接登顶Artificial Analysis文转视频全球榜，超越Veo 3.1、Sora 2等强劲对手。相比一个月前Preview版本的全球第2名，此次升级实现了显著的能力跃升，特别是在全模态强化学习体系和新增关键帧参考与网格参考功能上的突破。SkyReels-V4能够生成逻辑连贯、画质达1080p、时长15秒的高质量视频，并支持复杂剧情与音画同步创作。该模型还被应用于天工AI旗下短剧平台DramaWave，后者月活已突破8000万，标志着AI视频生成迈向工业化生产阶段。据悉，SkyReels-V4将在月底中关村论坛年会正式发布，其多模态融合技术或为未来内容生态奠定基础。

原文链接

跨界思维

03-19 16:05:16

分享至

打开微信扫一扫

内容投诉

生成图片

爱诗科技完成3亿美元C轮融资，鼎晖领投，开启“实时交互”视频生成新纪元

2026年3月，AI视频生成企业爱诗科技完成3亿美元C轮融资，由鼎晖领投，刷新亚洲AI视频领域单次融资纪录。公司技术实力获国际认可，PixVerse V5.6模型在图生视频与文生视频赛道位列全球第二。创始人王长虎表示，爱诗正从生成视频迈向实时交互的“可玩现实”，其发布的PixVerse R1实现用户指令驱动视频走向。目前，爱诗科技全球用户突破1亿，MAU超1600万，并与上万家企业合作。本轮融资将用于深耕通用视频模型及推动API商业化落地，助力全球创作者跨越技术鸿沟，开启AIGC数字内容新纪元。

原文链接

虚拟微光

03-12 15:44:44

分享至

打开微信扫一扫

内容投诉

生成图片

让 AI“说人话”：微软 Copilot 上线测试 Real Talk，真诚和你对话

1月20日，微软为应对Google Gemini和ChatGPT的竞争，推出适用于Copilot的Real Talk功能并邀请全球用户测试。该功能通过“深度”和“写作风格”调整AI回应，使其对话更真诚、类人化，同时允许用户查看AI思维过程。与以往不同，Real Talk展现好奇心，甚至会反驳不合理问题，显著提升互动活跃度。目前，Copilot网页端市场份额仅约1%，微软希望通过此功能扭转局面。该功能已在基础版Microsoft 365订阅中开放，尚不清楚基于微软自研模型还是OpenAI的Sora模型。

原文链接