大模型不再只是生成：智象未来CTO姚霆谈AI如何开始“完成”一个“创作”

2026-03-30 20:06:34

灵感Phoenix

发布在

科普

阅读：985

标题：大模型不再只是生成：智象未来CTO姚霆谈AI如何“完成创作”

正文：
过去一年，AI行业的竞争已从单项能力的比拼转向系统化任务的实现。文生图、图生视频等技术模块逐渐被整合到统一框架下，目标是让模型不仅生成内容，还能理解复杂意图、调动多种能力，完成端到端的创作任务。这种趋势使“世界模型”的竞争核心从单一模型转向模型、Agent、技能与应用场景的整体协同。

智象未来联合创始人兼CTO姚霆认为，“世界模型”的真正分野在于谁能率先搭建出一套可运行、可调用、可商业化的全模态生产系统。相比单纯讨论生成能力的优劣，他更关注模型如何从单点能力跃迁为创作底座，技能如何高效安全地管理与编排，以及应用如何反哺模型迭代。这不仅是对一家AI公司的产品路径探讨，更是对行业未来竞争方向的回应。

智象未来的核心团队源自微软亚洲研究院，曾参与全球首个文生视频研究，并在京东主导多项商业化项目，如以图搜图、3D商品生成和物流机械臂视觉方案。2023年，团队创立智象未来，专注于多模态大模型研发，提出“1+3+N”布局：一个全模态世界模型底座支撑专业视频创作工具、互动营销应用和AI影视创作三大出口。目前，公司ARR已达数千万美元级别，并开源HiDream-I1模型。

姚霆将世界模型分为三类：高层知识压缩型、中层表达学习型和底层像素生成型。他认为，未来的全模态架构应能同时处理文本、图像、视频、3D及动作，实现端到端的任务交付。产品形态上，Agentic平台将成为关键载体，通过Harness对多模态技能进行管理和编排，满足用户的多样化创作需求。

这套模型在具身智能、游戏和数字孪生领域具有巨大潜力。例如，在具身智能中，它可生成高质量训练数据；在游戏和影视中，它支持互动影游和内容延展。智象未来已在影视领域取得显著成果，如2026年春晚合肥分会场7分钟视频的AI支持，以及国内首批AIGC短剧《意向未来》和《量子湖传说》的制作。

面对字节、快手等巨头的竞争，姚霆强调初创公司的机会在于认知更新、架构创新、快速迭代和灵活组织。智象未来通过持续的技术突破，如扩散自回归架构和推理成本优化，保持领先优势。此外，公司正优先打造端到端的创作智能体Agent平台，整合全模态生成模型和海量技能，为用户提供无缝创作体验。

投资人看重智象未来的技术积淀、产品价值和商业化潜力。未来，公司将聚焦全模态技术和生产力场景落地，推动AI创作进入新阶段。

原文链接

本文链接：https://kx.umi6.com/article/34288.html

转载请注明文章出处

Agent