1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

2月10日,豆包发布视频生成实验模型“VideoWorld”,无需依赖语言模型,仅通过视觉信息即可认知世界。VideoWorld在300M参数量下表现出色,已在多项测试中达到专业5段9x9围棋水平。不同于主流多模态模型,VideoWorld主要处理纯视觉信号的学习,实现理解和推理任务。团队采用潜在动态模型(LDM)高效压缩视频帧间变化信息。不过,该模型在真实世界应用中面临高质量视频生成和多环境泛化的挑战。AI视觉学习能力的提升有望催生更多AI应用,国内AI大模型多模态能力持续提升。

原文链接
本文链接:https://kx.umi6.com/article/13027.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
字节跳动与北京大学成立豆包大模型联合实验室
2024-12-13 13:25:54
联想与火山引擎官宣合作,为AI桌面助手接入豆包大模型
2024-12-27 22:11:36
百万 tokens 降至 0.8 元后,消息称字节跳动豆包大模型毛利率达 50%
2025-01-22 19:02:33
豆包:视频生成模型“VideoWorld”可仅靠视觉认知世界 现已开源
2025-02-10 14:10:40
OPPO Find X8新机接入豆包大模型
2024-10-30 15:19:03
豆包大模型日均Tokens使用量破5000亿,模型家族再升级
2024-07-25 18:17:02
杀疯了!字节豆包视觉理解模型价格下降85%,火山引擎谭待:现在不太关注市场竞争
2024-12-18 17:35:19
豆包大模型发布以来日均Tokens使用量超过5000亿
2024-08-21 16:44:46
火山引擎正式发布豆包大模型 1.8,具备更强多模态 Agent 能力
2025-12-18 11:43:45
知名爆料人:苹果首款AI视觉TWS设备已进入开发后期阶段
2026-05-08 09:08:52
豆包大模型日均tokens使用量超过4万亿
2024-12-18 10:29:48
火山引擎发布豆包大模型文旅解决方案
2024-08-16 08:22:19
机构密集调研豆包概念股!龙头12天7板,近两个月接待量居前热门股名单来了
2024-12-21 15:59:48
24小时热文
更多
扫一扫体验小程序