标题:多模态=AGI入场券?阶跃星辰姜大昕:死磕基座大模型,探索多模态理解生成一体化
衡宇 发自 凹非寺
量子位 | 公众号 QbitAI
当大模型赛道中许多玩家转向更聚焦的方向时,阶跃星辰选择坚持基础大模型研发。创始人兼CEO姜大昕解释称,行业技术仍处于快速发展的陡峭区间,阶跃不愿错过主流趋势。同时,他强调应用与模型相辅相成,模型决定应用上限,应用反馈数据推动模型进步。
过去一年,阶跃星辰产品形态变化明显:C端助手App从“跃问”更名为“阶跃AI”,从类ChatGPT转向Agent平台,最终服务于C端用户。姜大昕认为,大模型的商业化依赖技术突破,当前重点仍是提升智能上限。
姜大昕总结了两大前沿趋势:一是从模仿学习到强化学习,二是从多模态融合迈向多模态理解生成一体化。阶跃星辰已发布22款基座模型,其中七成为多模态模型,涵盖图像、视频、音乐等多个方向,被业内称为“多模态卷王”。
多模态理解生成一体化是阶跃星辰的核心方向,即将理解与生成统一在一个模型中,而非分段处理。姜大昕指出,语言模型已实现理解生成一体化,但视觉领域尚需解决高维度连续分布带来的复杂性问题。阶跃正研发视觉领域的生成一体化架构,其图像编辑模型Step1X-Edit已初步实现这一目标,但仍需优化。
姜大昕坦言,理解生成一体化要求全面实力,阶跃通过多条技术路线并行探索,以期实现突破。尽管挑战重重,但他对团队实力充满信心,认为多模态理解生成一体化将是通向AGI的关键一步。
原文链接
本文链接:https://kx.umi6.com/article/18409.html
转载请注明文章出处
相关推荐
.png)
换一换
复旦大学/上海创智学院邱锡鹏:Context Scaling,通往AGI的下一幕
2025-06-15 12:57:46
Llama 4发布:我看到了DeepSeek的影子
2025-04-06 16:06:56
7B模型搞定AI视频通话,阿里最新开源炸场,看听说写全模态打通,开发者企业免费商用
2025-03-27 13:46:24
448 文章
70129 浏览
24小时热文
更多

-
2025-07-21 11:21:54
-
2025-07-21 11:20:45
-
2025-07-21 11:19:36