豆包开源视频生成模型 VideoWorld：首创免语言模型依赖认知世界

2025-02-10 15:13:00

未来笔触

发布在

快讯

阅读：216

2月10日，豆包大模型团队联合北京交通大学、中国科学技术大学开发的视频生成模型“VideoWorld”开源。该模型首次实现无需依赖语言模型即可认知世界，专注于纯视觉信号学习。VideoWorld采用潜在动态模型高效压缩视频帧间变化信息，提升了知识学习效率和效果。无需强化学习搜索或奖励函数机制，已达到专业围棋水平并在多种环境中执行机器人任务。更多信息参见相关链接。

原文链接

本文链接：https://kx.umi6.com/article/13024.html

转载请注明文章出处

VideoWorld