潞晨尤洋:视频生成的GPT-4时刻,3年后可以见证 | MEET 2025
奥特曼称,Sora标志着视频生成大模型的GPT-1时刻。从年初至今,国内外各大企业纷纷投入视频生成领域,带来了许多新模型,视频和影视行业随之变革。
尽管当下视频生成模型仍面临诸多挑战,如空间理解和物理规律的认知,我们期待着GPT-3.5/4时刻的到来。国内初创公司潞晨科技正致力于解决这些问题。
尤洋博士毕业于UC伯克利,现任新加坡国立大学校长青年教授,创立了潞晨科技。该公司不仅在加速计算领域有所建树,还推出了视频生成模型VideoOcean,为行业提供更具性价比的选择。
尤洋博士认为,理想的视频生成模型应具备精细文本控制、任意机位/角度、角色一致性和风格定制化四大特性。他预计,3年后将迎来视频生成的GPT-3.5/4时刻。
潞晨科技的VideoOcean正处于测试阶段,已展示了初步成果。该模型能在描述引导下生成精确图像,支持任意机位和角度,保持角色一致性,并实现风格定制化。尤洋强调,AI视频大模型未来三年的发展重点在于提升模型与现实世界连接的能力。
此外,潞晨科技还开发了开源项目Open-Sora,受到多家国际企业的关注和应用。未来,AI视频大模型有望降低制作成本,突破现实限制,提高行业效率。
原文链接
本文链接:https://kx.umi6.com/article/11142.html
转载请注明文章出处
相关推荐
.png)
换一换
微软开启 AI 办公新时代:Microsoft 365 Copilot Chat 更名上线
2025-01-16 10:53:32
微软开源视频Tokenizer新SOTA!显著优于Cosmos Tokenizer和Open-Sora
2024-12-26 12:32:40
OpenAI突发新模型,用GPT-4给GPT-4“找茬”
2024-06-28 15:28:02
418 文章
63780 浏览
24小时热文
更多

-
2025-07-19 21:58:20
-
2025-07-19 21:57:13
-
2025-07-19 20:57:00