视频生成 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

PixVerse（拍我AI）V5.5发布：国内首款分镜+音频一键生成AI视频大模型

2025年12月2日，爱诗科技发布PixVerse（拍我AI）V5.5，这是国内首款支持分镜+音频一键生成的AI视频大模型。新版本实现从单镜头到完整叙事短片的突破，用户只需输入提示词即可生成含多镜头、音画同步的高质量视频。其核心升级包括多角色音画同步、镜头语言设计及模糊信息理解能力，大幅缩短创作时间，提升效率。此外，平台新增Swap、Remix、Modify三大编辑功能，助力二次创作与精修。目前，PixVerse已拥有超1亿用户，成为全球创作者首选的AI视频工具，广泛应用于影像、广告等领域，推动AI视频技术普惠化。

原文链接

电子诗篇

12-02 12:10:11

AI视频生成

PixVerse

分镜+音频

分享至

打开微信扫一扫

内容投诉

生成图片

Sora 2两月留存率接近0%，奥特曼得学抖音快手？

2025年12月，Sora 2的两月留存率接近0%，引发行业关注。作为OpenAI推出的视频生成应用，Sora 2初期表现强劲，iOS首周下载破百万，Android首日达47万，但30天留存率仅1%，60天几乎为0%。用户流失主要因生成质量不稳定、成片率低（仅5%-10%）、渲染时间长及社区功能缺陷。此外，高昂的算力成本（日均1500万美元）和商业化困境进一步加剧问题。尽管技术先进，但用户体验不佳，难以与抖音、快手等竞争。Sora 2的失败警示：技术领先不等于产品成功，AI视频生成行业仍需探索可持续商业模式。

原文链接

新智燎原

12-01 17:20:48

AI视频生成

Sora 2

用户留存率

分享至

打开微信扫一扫

内容投诉

生成图片

腾讯元宝上线一句话、一张图生成视频，基于混元大模型打造

11月21日，腾讯元宝上线了一句话、一张图生成视频功能，基于混元大模型团队最新开源的HunyuanVideo 1.5模型打造。该模型采用Diffusion Transformer（DiT）架构，参数达8.3B，支持生成5-10秒高清视频。用户可通过输入文字描述实现“文生视频”，或上传图片配合文字提示将静态图片转化为动态视频。新功能已率先在「元宝」平台推出，为内容创作者提供更高效的视频生成工具，进一步拓展了AI技术在多媒体领域的应用。

原文链接

AI幻想空间站

11-21 14:22:17

混元大模型

腾讯元宝

视频生成

分享至

打开微信扫一扫

内容投诉

生成图片

腾讯开源视频生成模型 HunyuanVideo 1.5

11月21日，腾讯混元大模型团队宣布开源最新视频生成模型HunyuanVideo 1.5。该模型基于Diffusion Transformer（DiT）架构，参数量为8.3B，是一款轻量级工具，可生成5-10秒高清视频。据悉，这一模型已在“腾讯元宝”平台上线，进一步提升了视频生成的效率与质量。此次开源将为开发者和研究者提供更强大的技术支持，推动视频生成领域的发展。（记者李佳怡）

原文链接

量子黑客

11-21 12:21:43

HunyuanVideo 1.5

腾讯

视频生成模型

分享至

打开微信扫一扫

内容投诉

生成图片

何必DiT！字节首次拿着自回归，单GPU一分钟生成5秒720p视频 | NeurIPS’25 Oral

2025年11月，字节跳动商业化技术团队发布论文《InfinityStar》，提出一种基于自回归的视频生成方法，成功入围NeurIPS’25 Oral。该方法在VBench基准上首次超越扩散模型，单GPU一分钟内可生成5秒720p视频，效率比主流DiT（Diffusion Transformer）快一个数量级。InfinityStar采用时空金字塔建模架构，结合离散自回归和粗到精预测机制，大幅减少生成步骤，同时支持文生图、文生视频、图生视频及交互式长视频生成等多任务处理。实验显示，其在GenEval、DPG及VBench等基准测试中表现优异，尤其在指令遵循和视频流畅性方面超越HunyuanVideo等基于DiT的方法。论文、代码及体验地址已公开，可通过Discord社区申请试用。

原文链接

DreamCoder

11-14 13:59:52

InfinityStar

自回归模型

视频生成

分享至

打开微信扫一扫

内容投诉

生成图片

AI 视频背后的“豪赌”：消息称 OpenAI Sora 日均烧钱 1500 万美元

11月11日，OpenAI推出的视频生成应用Sora自9月30日上线以来，下载量迅速突破400万次，日均生成数百万条AI视频。据《福布斯》估算，Sora年化成本或超50亿美元，日均烧钱约1500万美元，项目负责人坦言当前经济状况不可持续。OpenAI正以巨额亏损抢占市场份额，寄望未来单位成本下降与商业化收入攀升。分析师指出，GPU计算需求将随技术进步大幅降低，推理成本可能在2027年前降至当前的1/15。此外，免费用户数据为模型优化提供支持，同时算力支出可作为税盾节税。然而，因成本飙升，OpenAI计划缩减免费额度，CEO奥尔特曼表示广告模式无法覆盖算力开支，未来将探索高价值用户付费等商业模式。

原文链接

虚拟微光

11-11 21:30:11

AI视频生成

OpenAI Sora

算力成本

分享至

打开微信扫一扫

内容投诉

生成图片

研究显示谷歌 AI 模型 Veo-3 可生成逼真手术视频，但缺乏实质性医学理解

11月9日，研究人员测试谷歌AI模型Veo-3生成手术视频的能力，发现其虽能生成逼真画面，但缺乏医学逻辑理解。研究使用SurgVeo基准评测，涵盖50段真实手术视频，由4名外科医生评分。结果显示，Veo-3在腹腔手术中视觉合理性初评3.72分，但器械操作和手术逻辑性分别仅1.78分和1.61分；神经外科表现更差，手术逻辑性评分低至1.13分。超93%错误源于医学逻辑问题，如虚构器械或违反生理规律。提供更多上下文未显著改善结果，表明模型缺乏医学推理能力。团队计划开源SurgVeo数据集以推动改进，并警示此类AI用于医学培训可能误导医学生或手术机器人，强调现有系统远未达到安全应用标准。

原文链接

LunarCoder

11-09 19:41:04

医学理解

手术视频生成

谷歌AI模型

分享至

打开微信扫一扫

内容投诉

生成图片

OpenAI 视频生成应用 Sora 登陆安卓平台，依旧需要邀请码

11月5日，OpenAI旗下AI视频生成应用Sora正式登陆安卓平台，仍需邀请码使用。此前，Sora于9月30日上线iOS平台，迅速成为苹果App Store下载量最高的免费应用，并在该类别中排名第五。Sora允许用户通过文本提示快速生成短视频，支持拼接视频和同一角色多片段创作，标志着OpenAI对社交媒体产品的尝试。然而，该应用也引发虚假信息、深度伪造及版权侵权担忧，例如未经授权使用名人形象或游戏角色。对此，OpenAI加强了Sora 2模型的保护措施，限制复制未授权人物声音和形象的能力。

原文链接

智慧棱镜

11-05 07:51:32

AI视频生成

OpenAI

Sora

分享至

打开微信扫一扫

内容投诉

生成图片

OpenAI Sora 应用限时开放：美、加、日、韩用户无需邀请码即可进入

11月2日，OpenAI宣布其Sora应用程序限时开放，美国、加拿大、日本和韩国用户无需邀请码即可直接使用。该应用基于OpenAI的AI视频生成技术，可将文本和图像转化为超写实视频，支持电影级场景或动漫短片生成。Sora于10月1日上线iOS平台，最初采用邀请制，界面类似TikTok，允许用户上传短视频用于AI深度伪造创作。OpenAI称其可能成为‘视频生成领域的ChatGPT时刻’，未来计划扩展至更多国家。此前每位受邀用户可分享四个额外邀请码。

原文链接

幻彩逻辑RainbowLogic

11-02 15:28:45

OpenAI Sora

视频生成

限时开放

分享至

打开微信扫一扫

内容投诉

生成图片

剪映前AI产品负责人创业多模态Agent，做懂上下文的007乙方，成立半月融资数百万美元

2025年10月，前剪映AI产品负责人廖谦创立‘极致上下文’公司，专注开发多模态Agent，面向营销场景提供从创意到视频生成的端到端服务。成立仅半个月即获硅谷美元基金HT Investment与BV百度风投数百万美元投资。公司目标是打造像‘007乙方’一样的AI助手，帮助用户以极简交互实现精准内容生成。廖谦认为，AI下一阶段核心竞争力在于帮助品牌和个人更好地表达，未来将拓展至教育、娱乐等领域。此前，廖谦在腾讯、字节跳动及生数科技积累了丰富经验，并主导了多项创新功能研发。他表示，当前技术已进入‘可用’拐点，创业公司有机会通过深耕用户需求定义新内容形态和协作方式。

原文链接

DreamCoder

10-29 12:50:06

AI视频生成

多模态Agent

极致上下文

分享至

打开微信扫一扫

内容投诉

生成图片

加载更多