综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2025年12月2日,爱诗科技发布PixVerse(拍我AI)V5.5,这是国内首款支持分镜+音频一键生成的AI视频大模型。新版本实现从单镜头到完整叙事短片的突破,用户只需输入提示词即可生成含多镜头、音画同步的高质量视频。其核心升级包括多角色音画同步、镜头语言设计及模糊信息理解能力,大幅缩短创作时间,提升效率。此外,平台新增Swap、Remix、Modify三大编辑功能,助力二次创作与精修。目前,PixVerse已拥有超1亿用户,成为全球创作者首选的AI视频工具,广泛应用于影像、广告等领域,推动AI视频技术普惠化。
原文链接
2025年12月,Sora 2的两月留存率接近0%,引发行业关注。作为OpenAI推出的视频生成应用,Sora 2初期表现强劲,iOS首周下载破百万,Android首日达47万,但30天留存率仅1%,60天几乎为0%。用户流失主要因生成质量不稳定、成片率低(仅5%-10%)、渲染时间长及社区功能缺陷。此外,高昂的算力成本(日均1500万美元)和商业化困境进一步加剧问题。尽管技术先进,但用户体验不佳,难以与抖音、快手等竞争。Sora 2的失败警示:技术领先不等于产品成功,AI视频生成行业仍需探索可持续商业模式。
原文链接
11月21日,腾讯元宝上线了一句话、一张图生成视频功能,基于混元大模型团队最新开源的HunyuanVideo 1.5模型打造。该模型采用Diffusion Transformer(DiT)架构,参数达8.3B,支持生成5-10秒高清视频。用户可通过输入文字描述实现“文生视频”,或上传图片配合文字提示将静态图片转化为动态视频。新功能已率先在「元宝」平台推出,为内容创作者提供更高效的视频生成工具,进一步拓展了AI技术在多媒体领域的应用。
原文链接
11月21日,腾讯混元大模型团队宣布开源最新视频生成模型HunyuanVideo 1.5。该模型基于Diffusion Transformer(DiT)架构,参数量为8.3B,是一款轻量级工具,可生成5-10秒高清视频。据悉,这一模型已在“腾讯元宝”平台上线,进一步提升了视频生成的效率与质量。此次开源将为开发者和研究者提供更强大的技术支持,推动视频生成领域的发展。(记者 李佳怡)
原文链接
2025年11月,字节跳动商业化技术团队发布论文《InfinityStar》,提出一种基于自回归的视频生成方法,成功入围NeurIPS’25 Oral。该方法在VBench基准上首次超越扩散模型,单GPU一分钟内可生成5秒720p视频,效率比主流DiT(Diffusion Transformer)快一个数量级。InfinityStar采用时空金字塔建模架构,结合离散自回归和粗到精预测机制,大幅减少生成步骤,同时支持文生图、文生视频、图生视频及交互式长视频生成等多任务处理。实验显示,其在GenEval、DPG及VBench等基准测试中表现优异,尤其在指令遵循和视频流畅性方面超越HunyuanVideo等基于DiT的方法。论文、代码及体验地址已公开,可通过Discord社区申请试用。
原文链接
11月11日,OpenAI推出的视频生成应用Sora自9月30日上线以来,下载量迅速突破400万次,日均生成数百万条AI视频。据《福布斯》估算,Sora年化成本或超50亿美元,日均烧钱约1500万美元,项目负责人坦言当前经济状况不可持续。OpenAI正以巨额亏损抢占市场份额,寄望未来单位成本下降与商业化收入攀升。分析师指出,GPU计算需求将随技术进步大幅降低,推理成本可能在2027年前降至当前的1/15。此外,免费用户数据为模型优化提供支持,同时算力支出可作为税盾节税。然而,因成本飙升,OpenAI计划缩减免费额度,CEO奥尔特曼表示广告模式无法覆盖算力开支,未来将探索高价值用户付费等商业模式。
原文链接
11月9日,研究人员测试谷歌AI模型Veo-3生成手术视频的能力,发现其虽能生成逼真画面,但缺乏医学逻辑理解。研究使用SurgVeo基准评测,涵盖50段真实手术视频,由4名外科医生评分。结果显示,Veo-3在腹腔手术中视觉合理性初评3.72分,但器械操作和手术逻辑性分别仅1.78分和1.61分;神经外科表现更差,手术逻辑性评分低至1.13分。超93%错误源于医学逻辑问题,如虚构器械或违反生理规律。提供更多上下文未显著改善结果,表明模型缺乏医学推理能力。团队计划开源SurgVeo数据集以推动改进,并警示此类AI用于医学培训可能误导医学生或手术机器人,强调现有系统远未达到安全应用标准。
原文链接
11月5日,OpenAI旗下AI视频生成应用Sora正式登陆安卓平台,仍需邀请码使用。此前,Sora于9月30日上线iOS平台,迅速成为苹果App Store下载量最高的免费应用,并在该类别中排名第五。Sora允许用户通过文本提示快速生成短视频,支持拼接视频和同一角色多片段创作,标志着OpenAI对社交媒体产品的尝试。然而,该应用也引发虚假信息、深度伪造及版权侵权担忧,例如未经授权使用名人形象或游戏角色。对此,OpenAI加强了Sora 2模型的保护措施,限制复制未授权人物声音和形象的能力。
原文链接
11月2日,OpenAI宣布其Sora应用程序限时开放,美国、加拿大、日本和韩国用户无需邀请码即可直接使用。该应用基于OpenAI的AI视频生成技术,可将文本和图像转化为超写实视频,支持电影级场景或动漫短片生成。Sora于10月1日上线iOS平台,最初采用邀请制,界面类似TikTok,允许用户上传短视频用于AI深度伪造创作。OpenAI称其可能成为‘视频生成领域的ChatGPT时刻’,未来计划扩展至更多国家。此前每位受邀用户可分享四个额外邀请码。
原文链接
2025年10月,前剪映AI产品负责人廖谦创立‘极致上下文’公司,专注开发多模态Agent,面向营销场景提供从创意到视频生成的端到端服务。成立仅半个月即获硅谷美元基金HT Investment与BV百度风投数百万美元投资。公司目标是打造像‘007乙方’一样的AI助手,帮助用户以极简交互实现精准内容生成。廖谦认为,AI下一阶段核心竞争力在于帮助品牌和个人更好地表达,未来将拓展至教育、娱乐等领域。此前,廖谦在腾讯、字节跳动及生数科技积累了丰富经验,并主导了多项创新功能研发。他表示,当前技术已进入‘可用’拐点,创业公司有机会通过深耕用户需求定义新内容形态和协作方式。
原文链接
加载更多
暂无内容