综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law
MiniMax海螺视频团队近日开源了一项重要成果,解决了困扰行业已久的难题:为什么增加视觉分词器(Tokenizer)的算力投入,却无法显著提升生成模型的效果?
当前主流的图像/视频生成模型采用“两阶段”框架:...
原文链接
微软开源了一款全能视频Tokenizer——VidTok,其在连续和离散、不同压缩率等多种设定下,性能全面超越现有SOTA模型。测试显示,VidTok在PSNR、SSIM、FVD、LPIPS等指标上表现优异,尤其在离散Tokenizer中优于英伟达的Cosmos Tokenizer,而在连续Toke...
原文链接
加载更多
暂无内容