1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

2025年11月,字节跳动商业化技术团队发布论文《InfinityStar》,提出一种基于自回归的视频生成方法,成功入围NeurIPS’25 Oral。该方法在VBench基准上首次超越扩散模型,单GPU一分钟内可生成5秒720p视频,效率比主流DiT(Diffusion Transformer)快一个数量级。InfinityStar采用时空金字塔建模架构,结合离散自回归和粗到精预测机制,大幅减少生成步骤,同时支持文生图、文生视频、图生视频及交互式长视频生成等多任务处理。实验显示,其在GenEval、DPG及VBench等基准测试中表现优异,尤其在指令遵循和视频流畅性方面超越HunyuanVideo等基于DiT的方法。论文、代码及体验地址已公开,可通过Discord社区申请试用。

原文链接
本文链接:https://kx.umi6.com/article/28418.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
OpenAI发布最新视频模型Sora Turbo,会员免费用,网站被挤爆
2024-12-10 10:51:02
Sora二代实机演示曝光!解锁图生视频,奥特曼暗示:期待周一
2024-12-09 13:23:54
开源全家桶又添一“元”,腾讯混元大模型公布最新进展
2024-12-04 14:41:21
SkyReels-V2开源:突破视频生成技术边界,开启无限时长电影生成新时代
2025-04-21 10:36:16
鹅厂开源视频生成大杀器!参考图主体精准复刻,还能编辑现有视频
2025-05-09 21:57:02
阿里开源通义新模型:指定首尾图片生成视频
2025-04-18 12:13:31
腾讯版Sora开源后,被提速8倍!官方点赞并预告:下月上新图生视频
2024-12-19 22:09:00
全球首个无限时长视频生成!新扩散模型引爆万亿市场,电影级理解,全面开源
2025-04-21 16:45:29
Midjourney入局视频生成,图像模型V7不断更新,视觉卷王实锤了
2025-06-17 15:24:04
快手可灵 2.5 Turbo 模型上线,较上代模型便宜近 30%
2025-09-23 20:22:21
中国AI融资总额27762亿元,启明创投周志峰预测:3年内视频生成将全面爆发
2024-07-09 00:29:02
字节跳动 AI 助手豆包上线图片理解功能,上传图片即可“读图”
2024-12-04 08:33:01
11B模型拿开源视频生成SOTA!仅用224张GPU训练,训练成本省10倍
2025-03-13 13:15:44
24小时热文
更多
扫一扫体验小程序