2月10日,豆包大模型团队联合北京交通大学、中国科学技术大学开发的视频生成模型“VideoWorld”开源。该模型首次实现无需依赖语言模型即可认知世界,专注于纯视觉信号学习。VideoWorld采用潜在动态模型高效压缩视频帧间变化信息,提升了知识学习效率和效果。无需强化学习搜索或奖励函数机制,已达到专业围棋水平并在多种环境中执行机器人任务。更多信息参见相关链接。
原文链接
本文链接:https://kx.umi6.com/article/13024.html
转载请注明文章出处
相关推荐
.png)
换一换
为什么DeepSeek回答前总先“嗯”一下
2025-04-30 20:17:08
豆包开源视频生成模型 VideoWorld:首创免语言模型依赖认知世界
2025-02-10 15:13:00
AI视觉基础:学习压缩图像
2024-06-14 17:36:22
431 文章
72217 浏览
24小时热文
更多

-
2025-07-20 23:09:27
-
2025-07-20 22:09:17
-
2025-07-20 21:10:03