1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:拳打可灵,脚踢 Veo 3,谁是物理世界的「懂王」?

一个优秀的多模态视频生成大模型涉及跨模态理解、时序一致性、编辑能力和成本控制等复杂系统。这条赛道上,MiniMax的Hailuo 02脱颖而出,其ELO得分超越谷歌Veo 3和快手Kling 2.0,位列全球第二。

Hailuo 02的独特优势在于复杂运动场景的真实感。例如,“马跃起,落地奔跑”不仅要求姿态同步,还需体现物理规律下的力传递层次感。Hailuo 02在细节处理上远超对标模型,无论是马鬃毛还是人发的动态都极具真实感。

在“hellokitty打网球”测试中,Hailuo 02能准确呈现球拍与球的互动,而对标模型则出现球脱离正常轨迹的现象。同样,在滑雪场景中,Hailuo 02不仅能重建雪场环境,还能模拟真实的雪痕和雪浪,而竞品则存在穿模和背景不连贯的问题。

Hailuo 02的底层架构Noise-aware Compute Redistribution(NCR)显著提升了训练和推理效率,使模型参数规模扩大三倍,数据量提升四倍。这不仅增强了细节表现力,还大幅降低了成本,使其在高清视频生成中性价比远超同行。

MiniMax创始人强调,Hailuo 02不仅是技术突破,更是对世界理解力的提升。未来,Hailuo 02将在生成速度、稳定性及高阶功能上持续优化,致力于让更多人享受到顶尖AI技术的便利。

原文链接
本文链接:https://kx.umi6.com/article/20540.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
DeepSeek 重新开放 API 充值
2025-02-25 16:01:49
黄仁勋:个人AI计算机已全面投产
2025-05-19 12:18:45
微软邀测必应视频创建器:免费 AI 生成视频,基于 OpenAI Sora 模型,最长 5 秒、最高 480P
2025-05-23 09:48:17
24小时热文
更多
扫一扫体验小程序