2026年1月20日,阶跃星辰宣布开源多模态模型Step3-VL-10B。该模型仅用10B参数量,在视觉感知、逻辑推理、数学竞赛及通用对话等基准测试中达到同规模SOTA水平,性能媲美甚至超越千亿级大模型如Gemini 2.5 Pro和Seed-1.5-VL。其核心亮点包括极致视觉感知、深层逻辑推演与长程推理、强大端侧Agent交互,并引入PaCoRe机制提升复杂任务表现。真实场景中,模型在STEM推理、竞赛数学、空间推理等领域表现出色。得益于全参数端到端预训练、大规模强化学习和创新推理机制,Step3-VL-10B证明小参数量也可实现高性能。目前Base和Thinking模型已开源,推动低成本、高效能的多模态能力向端侧下沉,重塑人机交互体验。
原文链接
本文链接:https://kx.umi6.com/article/31917.html
转载请注明文章出处
相关推荐
换一换
阶跃星辰杀入季后赛,强势跻身AI“新六小虎”第一梯队
2026-02-27 15:48:37
阶跃开源4B Agent模型,跑通所有安卓设备,手搓党一键部署
2025-11-30 16:17:01
行业首个:商汤发布并开源 NEO 原生多模态模型架构,实现视觉、语言深层统一
2025-12-02 23:39:14
阶跃星辰发布最强开源基座模型 Step 3.5 Flash,多家头部芯片厂商已完成适配
2026-02-02 11:32:23
Kimi最新多模态模型K2-VL提前现身
2026-01-05 15:13:56
全球最大开源视频模型,现在也Created in China了,阶跃出品
2025-02-18 13:15:12
阶跃新模型快到“没推理”!印奇上任,果然气势一新
2026-02-03 16:46:41
阶跃星辰新一代基础大模型 Step 3 正式开源:拥有强大视觉感知和复杂推理能力
2025-08-01 09:07:26
吉利汽车、千里科技、阶跃星辰三方开启汽车智能全域智能合作
2025-02-21 15:00:01
32B本地部署!阿里开源最新多模态模型:主打视觉语言,数学推理也很强
2025-03-25 09:39:46
模型“看视频写网页”,GPT-5仅36.35分!首个video2code基准发布
2025-10-19 15:51:15
抖音&LV-NUS开源多模态新模,以小博大刷新SOTA,8B推理比肩GPT-4o
2025-10-14 12:13:47
阶跃星辰变更为股份公司
2026-04-03 16:10:36
787 文章
714942 浏览
24小时热文
更多
-
2026-06-09 00:54:40 -
2026-06-09 00:53:08 -
2026-06-08 23:49:41