标题:拳打可灵,脚踢 Veo 3,谁是物理世界的「懂王」?
一个优秀的多模态视频生成大模型涉及跨模态理解、时序一致性、编辑能力和成本控制等复杂系统。这条赛道上,MiniMax的Hailuo 02脱颖而出,其ELO得分超越谷歌Veo 3和快手Kling 2.0,位列全球第二。
Hailuo 02的独特优势在于复杂运动场景的真实感。例如,“马跃起,落地奔跑”不仅要求姿态同步,还需体现物理规律下的力传递层次感。Hailuo 02在细节处理上远超对标模型,无论是马鬃毛还是人发的动态都极具真实感。
在“hellokitty打网球”测试中,Hailuo 02能准确呈现球拍与球的互动,而对标模型则出现球脱离正常轨迹的现象。同样,在滑雪场景中,Hailuo 02不仅能重建雪场环境,还能模拟真实的雪痕和雪浪,而竞品则存在穿模和背景不连贯的问题。
Hailuo 02的底层架构Noise-aware Compute Redistribution(NCR)显著提升了训练和推理效率,使模型参数规模扩大三倍,数据量提升四倍。这不仅增强了细节表现力,还大幅降低了成本,使其在高清视频生成中性价比远超同行。
MiniMax创始人强调,Hailuo 02不仅是技术突破,更是对世界理解力的提升。未来,Hailuo 02将在生成速度、稳定性及高阶功能上持续优化,致力于让更多人享受到顶尖AI技术的便利。
原文链接
本文链接:https://kx.umi6.com/article/20540.html
转载请注明文章出处
相关推荐
.png)
换一换
DeepSeek 重新开放 API 充值
2025-02-25 16:01:49
黄仁勋:个人AI计算机已全面投产
2025-05-19 12:18:45
微软邀测必应视频创建器:免费 AI 生成视频,基于 OpenAI Sora 模型,最长 5 秒、最高 480P
2025-05-23 09:48:17
438 文章
65330 浏览
24小时热文
更多

-
2025-07-18 23:46:25
-
2025-07-18 22:47:06
-
2025-07-18 22:46:21