1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:视觉模型智能涌现后,Scaling Law 不会到头

Scaling Law 或将终结,这是最近备受热议的话题之一。哈佛大学一篇名为《Scaling Laws for Precision》的论文表明,当下的语言模型在大量数据上经历了过度训练,继续叠加更多预训练数据可能适得其反。这意味着单纯依赖增加模型规模和数据量来提升性能的方法可能不再有效。

尽管如此,Scaling Law 在自然语言处理领域似乎已显现出瓶颈,但在多模态模型领域尚未被充分验证。清华系大模型公司生数科技最新发布的Vidu1.5显示,多模态领域的Scaling Law才刚刚起步。Vidu1.5通过持续的Scaling Up,已达到“奇点”时刻,涌现出“上下文能力”,能够理解并记忆多主体信息,对复杂主体进行更精准的控制。

除了对单个主体的精确控制,Vidu1.5还实现了多主体之间的一致性。用户可以上传包含人物角色、道具物体、环境背景等元素的图像,Vidu能够无缝融合这些元素并实现自然交互。Vidu在主体一致性方面的突破,不仅归功于Scaling Law,更源于其采用的无微调、大一统的技术架构。这一架构不同于业界主流方案,通过统一的底层模型技术架构实现,无需单独的数据收集、标注、微调,只需1到3张图就能输出高质量视频。

回顾大语言模型的发展历程,从GPT-2到GPT-3.5的质变标志是实现了从预训练加特定任务微调到整体统一框架的突破。Vidu1.5的推出,开启了多模态大模型的GPT-3.5时刻。生数科技CTO鲍凡表示,他们不会跟随Sora划定的路线,而是从一开始就瞄准通用多模态大模型的目标。

Vidu1.5的成功不仅在于技术架构,还在于视频模型的数据工程。鲍凡强调,高质量数据的Scaling Up带来了类似大语言模型的智能涌现。例如,Vidu1.5能够融合不同主体,创造出全新的角色。此外,Vidu1.5的智能涌现还体现在模型上下文能力的提升,能够对视频中角色、道具、场景进行统一控制。

鲍凡认为,视频模型上下文能力提升后有很大的想象空间。例如,输入几段王家卫的电影切片,可以生成一系列具有王家卫风格的视频片段。Vidu1.5在上下文能力方面的迭代也有自己的节奏,从单一主体到多主体,再到更复杂的因素,要求和难度逐步提升。

尽管面临快手、字节等大厂的竞争,生数科技凭借其独特的技术优势,正在逐步建立自己的技术壁垒。Vidu1.5不仅具备视频能力,还规划了4D模型、音频等更多模态,未来将实现更精确的运镜控制。生数科技的定位是通用多模态大模型,而非简单的世界模拟器,旨在解决更多实际问题。

Vidu1.5的推出证明了视频模型不只是Sora这一个答案。生数科技将继续沿着这条路径,不断精进,推动多模态大模型的发展。

原文链接
本文链接:https://kx.umi6.com/article/9127.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
3D打印火出圈了?一众网友秀“成果” 幕后推手竟是这款AI模型
2025-09-01 13:19:49
多模态模型挑战北京杭州地铁图!o3成绩显著,但跟人类有差距
2025-06-07 13:49:19
DeepSeek的Janus-Pro表现如何?
2025-01-28 15:49:21
不止OpenAI,谷歌和Anthropic AI模型开发也被爆遇瓶颈
2024-11-14 10:10:27
李开复周志华纵论AI大模型,商汤徐立倡议「打脸时刻」,万字梳理MEET’25大咖激辩,320万观众同见证
2024-12-12 20:03:19
Scaling Law触礁「数据墙」?Epoch AI发文预测LLM到2028年耗尽所有文本数据
2024-06-15 13:49:34
Scaling Law首次在自动驾驶赛道被验证!小鹏汽车CVPR演讲详解
2025-06-16 14:08:23
对话阶跃星辰CEO姜大昕:两年发布16款多模态模型,DeepSeek证明投流模式不成立
2025-05-08 16:31:26
2025年AI十大趋势预测
2024-12-27 08:52:59
Scaling Law不适用于投资行业?朱啸虎在2024WAIC再度“语出惊人”
2024-07-08 08:32:08
视觉模型智能涌现后, Scaling Law 不会到头
2024-11-22 12:00:19
多模态都是假的:最强模型数不清手指、认不出雷碧
2025-07-22 15:38:55
阿里通义千问宣布推出多模态模型 Qwen VLo,实现从感知到生成的跨越
2025-06-28 00:15:30
24小时热文
更多
扫一扫体验小程序