1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

2025年11月,字节跳动商业化技术团队发布论文《InfinityStar》,提出一种基于自回归的视频生成方法,成功入围NeurIPS’25 Oral。该方法在VBench基准上首次超越扩散模型,单GPU一分钟内可生成5秒720p视频,效率比主流DiT(Diffusion Transformer)快一个数量级。InfinityStar采用时空金字塔建模架构,结合离散自回归和粗到精预测机制,大幅减少生成步骤,同时支持文生图、文生视频、图生视频及交互式长视频生成等多任务处理。实验显示,其在GenEval、DPG及VBench等基准测试中表现优异,尤其在指令遵循和视频流畅性方面超越HunyuanVideo等基于DiT的方法。论文、代码及体验地址已公开,可通过Discord社区申请试用。

原文链接
本文链接:https://kx.umi6.com/article/28418.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
AI 视频新王全球爆火,威尔·斯密斯终于可以好好吃面(附大量实测演示)
2025-05-24 13:10:24
单GPU搞定高清长视频生成,效率×10!引入Mamba机制突破DiT瓶颈 | 普林斯顿&Meta
2025-06-18 16:39:37
Midjourney入局视频生成,图像模型V7不断更新,视觉卷王实锤了
2025-06-17 15:24:04
跳过“逐字生成”!蚂蚁集团赵俊博:扩散模型让我们能直接修改Token | MEET2026
2025-12-12 12:47:17
腾讯版Sora开源后,被提速8倍!官方点赞并预告:下月上新图生视频
2024-12-19 22:09:00
AI 视频生成王者 Sora 上线:OpenAI 的“魔法棒”,1080P@20 秒具象化你的想象力
2024-12-10 07:44:58
全栈AI基础设施支撑,跑出全球首个开放使用视频生成DiT模型
2025-04-28 11:46:30
500美元刷新SOTA!训练成本砍到1/200,华人团队重构视频生成范式
2025-07-17 15:24:48
腾讯元宝上线一句话、一张图生成视频,基于混元大模型打造
2025-11-21 14:22:17
Llama也能做图像生成!港大字节推出开源自回归文生图模型,在线体验已开放
2024-07-03 16:53:44
华人团队终结Token危机:扩散模型数据潜力超自回归三倍
2025-08-13 17:38:29
AI视频边生成边播放!首帧延迟仅1.3秒,生成速度9.4帧/秒|Adobe&MIT新研究
2024-12-10 15:56:19
腾讯AI视频生成曝光!与Sora同提示词PK,效果如何?
2024-12-02 14:51:40
24小时热文
更多
扫一扫体验小程序