标题:大模型不再只是生成:智象未来CTO姚霆谈AI如何“完成创作”
正文:
过去一年,AI行业的竞争已从单项能力的比拼转向系统化任务的实现。文生图、图生视频等技术模块逐渐被整合到统一框架下,目标是让模型不仅生成内容,还能理解复杂意图、调动多种能力,完成端到端的创作任务。这种趋势使“世界模型”的竞争核心从单一模型转向模型、Agent、技能与应用场景的整体协同。
智象未来联合创始人兼CTO姚霆认为,“世界模型”的真正分野在于谁能率先搭建出一套可运行、可调用、可商业化的全模态生产系统。相比单纯讨论生成能力的优劣,他更关注模型如何从单点能力跃迁为创作底座,技能如何高效安全地管理与编排,以及应用如何反哺模型迭代。这不仅是对一家AI公司的产品路径探讨,更是对行业未来竞争方向的回应。
智象未来的核心团队源自微软亚洲研究院,曾参与全球首个文生视频研究,并在京东主导多项商业化项目,如以图搜图、3D商品生成和物流机械臂视觉方案。2023年,团队创立智象未来,专注于多模态大模型研发,提出“1+3+N”布局:一个全模态世界模型底座支撑专业视频创作工具、互动营销应用和AI影视创作三大出口。目前,公司ARR已达数千万美元级别,并开源HiDream-I1模型。
姚霆将世界模型分为三类:高层知识压缩型、中层表达学习型和底层像素生成型。他认为,未来的全模态架构应能同时处理文本、图像、视频、3D及动作,实现端到端的任务交付。产品形态上,Agentic平台将成为关键载体,通过Harness对多模态技能进行管理和编排,满足用户的多样化创作需求。
这套模型在具身智能、游戏和数字孪生领域具有巨大潜力。例如,在具身智能中,它可生成高质量训练数据;在游戏和影视中,它支持互动影游和内容延展。智象未来已在影视领域取得显著成果,如2026年春晚合肥分会场7分钟视频的AI支持,以及国内首批AIGC短剧《意向未来》和《量子湖传说》的制作。
面对字节、快手等巨头的竞争,姚霆强调初创公司的机会在于认知更新、架构创新、快速迭代和灵活组织。智象未来通过持续的技术突破,如扩散自回归架构和推理成本优化,保持领先优势。此外,公司正优先打造端到端的创作智能体Agent平台,整合全模态生成模型和海量技能,为用户提供无缝创作体验。
投资人看重智象未来的技术积淀、产品价值和商业化潜力。未来,公司将聚焦全模态技术和生产力场景落地,推动AI创作进入新阶段。
-
2026-03-30 20:06:34 -
2026-03-30 19:03:53 -
2026-03-30 19:02:43