1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
阶跃星辰开源 10B 多模态模型 Step3-VL-10B,性能媲美千亿级大模型
2026年1月20日,阶跃星辰宣布开源多模态模型Step3-VL-10B。该模型仅用10B参数量,在视觉感知、逻辑推理、数学竞赛及通用对话等基准测试中达到同规模SOTA水平,性能媲美甚至超越千亿级大模型如Gemini 2.5 Pro和Seed-1.5-VL。其核心亮点包括极致视觉感知、深层逻辑推演与长程推理、强大端侧Agent交互,并引入PaCoRe机制提升复杂任务表现。真实场景中,模型在STEM推理、竞赛数学、空间推理等领域表现出色。得益于全参数端到端预训练、大规模强化学习和创新推理机制,Step3-VL-10B证明小参数量也可实现高性能。目前Base和Thinking模型已开源,推动低成本、高效能的多模态能力向端侧下沉,重塑人机交互体验。
未来编码者
01-20 19:24:31
Step3-VL-10B
多模态模型
阶跃星辰
分享至
打开微信扫一扫
内容投诉
生成图片
阶跃星辰:旗下开源语音模型 Step-Audio-R1.1 在全球权威评测中登顶
1月15日,阶跃星辰宣布其开源语音模型Step-Audio-R1.1在全球权威评测榜单Artificial Analysis Speech Reasoning中登顶榜首。该榜单专注于评估原生语音模型的复杂逻辑推理能力,核心指标包括准确率和首包延迟等。Step-Audio-R1.1以96.4%的准确率超越Grok、Gemini、GPT-Realtime等主流模型,刷新历史最佳成绩,并在性能与速度上全面领先。作为全球首个开源原生语音推理模型,Step-Audio-R1系列具备深度语音推理、实时响应和音频领域可扩展CoT等核心能力。最新版本R1.1进一步提升实时对话与复杂推理能力,完整实时语音API预计2月上线,目前chat模式已支持流式推理功能。
数码游侠
01-15 15:42:50
Step-Audio-R1.1
语音模型
阶跃星辰
分享至
打开微信扫一扫
内容投诉
生成图片
阶跃星辰语音模型登顶全球第一
1月15日,据财联社报道,阶跃星辰的原生语音推理模型Step-Audio-R1.1在大模型评测榜单Artificial Analysis Speech Reasoning中荣登全球第一。该榜单是评估“原生语音模型”的权威第三方基准之一,重点考察模型直接处理音频并完成复杂逻辑推理的能力,核心指标包括准确率和首包延迟等。此次登顶标志着阶跃星辰在语音模型领域的技术突破,进一步巩固了其在全球人工智能行业的领先地位。
AI幻想空间站
01-15 10:31:06
登顶榜首
语音模型
阶跃星辰
分享至
打开微信扫一扫
内容投诉
生成图片
阶跃星辰发布首个开源能在手机上落地的端侧 Agent:10 分钟可打造豆包手机同款
12月17日,阶跃星辰发布全新AI Agent系列模型「Step-GUI」,包括云端模型Step-GUI、首个面向GUI Agent的MCP协议,以及业内首个支持手机部署的开源端侧模型Step-GUI Edge。该模型可在淘宝、微博、抖音等超200个APP场景中执行任务,具备视觉理解能力,并能基于指令完成用户任务。个人开发者和硬件厂商均可使用这套方案,在终端快速打造类似功能的Agent助手,最快仅需10分钟即可部署上线,为移动端AI应用提供了高效解决方案。(记者 黄心怡)
虚拟微光
12-17 22:07:14
Step-GUI Edge
端侧 Agent
阶跃星辰
分享至
打开微信扫一扫
内容投诉
生成图片
阶跃星辰开源GUI Agent技术和4B GUI Agent模型
2025年12月1日,大模型独角兽阶跃星辰宣布开源其GUI Agent技术及4B GUI Agent模型。此次开源的GELab-Zero套组与豆包手机助手技术类型相似,并包含完整的配套基建。同时发布的4B模型(GELab-Zero-4B-preview)在手机端、电脑端等多个GUI榜单中刷新了同尺寸模型的性能纪录,取得SOTA成绩。这一成果标志着阶跃星辰在智能交互领域的重要进展。(记者 黄心怡)
智能视野
12-01 15:15:24
GUI Agent
开源
阶跃星辰
分享至
打开微信扫一扫
内容投诉
生成图片
阶跃开源4B Agent模型,跑通所有安卓设备,手搓党一键部署
2025年11月,阶跃星辰开源了GELab-Zero,一款支持所有安卓设备的4B GUI Agent模型。该模型在多个GUI榜单中刷新同尺寸性能纪录,取得SOTA成绩,并首次同步开放完整配套基建,支持一键部署。针对移动生态碎片化问题,GELab-Zero提供端到端解决方案,涵盖轻量化本地推理、多设备任务分发及多种Agent模式,大幅降低开发门槛。同时,阶跃开源基于真实业务场景的评测标准AndroidDaily,聚焦饮食、出行等六大生活核心维度,测试显示其准确率达73.4%。研究团队表示,未来将持续优化性能并扩展跨平台支持。项目已上线GitHub和Hugging Face。
数码游侠
11-30 16:17:01
GELab-Zero
GUI Agent
阶跃星辰
分享至
打开微信扫一扫
内容投诉
生成图片
阶跃星辰推出电脑端Agent
9月24日,阶跃星辰推出电脑端Agent——阶跃AI桌面伙伴,目前已上线测试。这款工具能够在电脑上为用户执行复杂任务,感知并响应用户需求,主动获取本地及互联网信息,支持智能检索本地文件、调用浏览器、系统日历、备忘录,并执行定时任务等操作。Mac版已开启内测,Windows版预计不久后推出。这一进展标志着阶跃星辰在端侧Agent领域的进一步探索。(记者黄心怡)
智能维度跳跃
09-24 14:46:34
AI桌面伙伴
端侧Agent
阶跃星辰
分享至
打开微信扫一扫
内容投诉
生成图片
阶跃星辰发布开源端到端语音大模型Step-Audio 2 mini
9月1日,阶跃星辰发布开源端到端语音大模型Step-Audio 2 mini。该模型统一建模语音理解、音频推理与生成,在音频理解、语音识别、跨语种翻译、情感解析、副语言解析及语音对话等任务中表现出色。它率先支持语音原生的Tool Calling能力,可实现联网搜索等功能,为语音技术领域带来新突破。
AI奇点纪元
09-01 12:18:45
Step-Audio 2 mini
语音大模型
阶跃星辰
分享至
打开微信扫一扫
内容投诉
生成图片
阶跃星辰新一代基础大模型 Step 3 正式开源:拥有强大视觉感知和复杂推理能力
7月31日,阶跃星辰宣布开源新一代基础大模型Step 3,该模型具备强大的视觉感知与复杂推理能力。Step 3采用MoE架构,总参数量321B,激活参数量38B,可高效处理跨领域知识、数学及视觉分析任务。通过MFA和AFD优化,其推理效率大幅提升,并已上线开放平台供用户体验。此外,随模型开源的还有StepMesh通信库,支持跨硬件部署。官方表示,Step 3在多个评测集中表现领先,且目前API服务正进行限时折扣,每百万token输入仅1.5元,输出4元。
像素宇宙
08-01 09:07:26
Step 3
多模态
阶跃星辰
分享至
打开微信扫一扫
内容投诉
生成图片
阶跃星辰发布新一代基础大模型 Step 3,华为昇腾芯片已首先实现搭载
2025年7月26日,阶跃星辰在上海发布新一代基础大模型Step 3,计划于7月31日开源。Step 3采用MoE架构,总参数量321B,激活参数量38B,是首个全尺寸、原生多模态推理模型,具备强大的视觉感知和复杂推理能力。该模型在多项榜单中取得SOTA成绩,并优化了国产芯片的推理效率,最高可达DeepSeek-R1的300%。华为昇腾芯片已率先实现搭载,沐曦、天数智芯等厂商也初步完成适配。阶跃星辰联合近10家厂商发起“模芯生态创新联盟”,推动硬件与模型的协同创新。
智能视野
07-26 08:34:56
Step 3
华为昇腾
阶跃星辰
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序