1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
WAIC 2025|阶跃发布新一代基模 Step 3:原生多模态,推理效率行业领先
2025世界人工智能大会前夕,阶跃星辰于7月25日在上海发布新一代基础大模型Step 3,主打原生多模态与行业领先的推理效率,将于7月31日开源。该模型采用MoE架构,参数量达321B,在MMMU等榜单中取得开源多模态推理模型的最优成绩。阶跃星辰联合多家芯片厂商发起“模芯生态创新联盟”,推动全产业链协同创新,并与上海国投达成深度战略合作,加速大模型应用落地。目前,Step 3已适配华为昇腾等芯片,广泛应用于手机、汽车及金融等领域。
AGI探路者
07-25 22:30:52
Step 3
多模态推理模型
模芯生态创新联盟
分享至
打开微信扫一扫
内容投诉
生成图片
阶跃星辰发布新一代基础大模型Step3
7月25日,阶跃星辰发布新一代基础大模型Step3,主打多模态推理能力,在国产芯片上32K上下文推理效率最高可达DeepSeek R1的300%。据悉,Step3计划于7月31日向全球开源,进一步推动技术共享与创新。(记者 黄心怡)
像素宇宙
07-25 17:34:14
Step3
多模态推理
阶跃星辰
分享至
打开微信扫一扫
内容投诉
生成图片
昆仑万维发布并开源 Skywork-R1V 3.0,多模态推理能力逼近人类专家水平
7月9日,昆仑万维发布并开源Skywork-R1V 3.0,其多模态推理能力逼近人类专家水平。新版本通过强化学习策略显著提升跨模态推理能力,在复杂逻辑建模和跨学科泛化上表现优异。模型基于InternVL-38B蒸馏数据训练,仅用约1.2万条监督微调样本和1.3万条强化学习样本,实现高效训练。在权威评测中,Skywork-R1V 3.0取得多项领先成绩:MMMU评测达76.0分,超越Claude-3.7-Sonnet和GPT-4.5;EMMA-Mini(CoT)评分40.3分,居开源模型首位;数学、物理、逻辑等领域均表现出色,部分指标超闭源模型。目前,模型已开放下载,涵盖HuggingFace、GitHub等平台。
神经网络领航员
07-09 11:04:18
Skywork-R1V 3.0
多模态推理
开源模型
分享至
打开微信扫一扫
内容投诉
生成图片
自变量机器人:统一框架下的具身多模态推理
标题:自变量机器人:统一框架下的具身多模态推理 正文:当熟练的木匠拿起锤子时,锤子仿佛消失了,因为它已融入使用者的本能。然而,最先进的机器人仍需反复识别工具并规划使用,这种割裂的认知方式使它们无法达到人类的直觉水平。具身智能的突破需要架构革新,而非现有系统的修补。 自变量机器人提出,应摒弃多...
阿达旻
06-20 21:06:19
具身智能
多模态推理
统一架构
分享至
打开微信扫一扫
内容投诉
生成图片
AI连电路图都看不懂?SeePhys新基准暴击多模态短板,正确率仅55%
标题:AI连电路图都看不懂?SeePhys新基准暴击多模态短板,正确率仅55% 当前顶尖AI模型能否真正“看懂”物理图像?全新基准SeePhys给出了答案,结果显示顶级模型准确率不足55%。 SeePhys由中山大学、苏黎世联邦理工学院、华为诺亚方舟实验室和香港大学联合推出,涵盖从初中到博士资格考试...
梦境编程师
05-29 15:35:22
AI模型
多模态推理
物理图像
分享至
打开微信扫一扫
内容投诉
生成图片
拿下38项第一!字节发布Seed1.5-VL多模态推理模型
标题:字节发布Seed1.5-VL多模态推理模型:轻量高效,表现卓越 正文:在60项主流基准测试中,字节发布的轻量级多模态推理模型Seed1.5-VL拿下了38项第一。该模型仅包含532M视觉编码器和200亿参数,却能在复杂谜题推理、OCR、图表理解及3D空间理解等方面媲美更大规模的顶级模型。 例如...
蝶舞CyberSwirl
05-14 15:15:44
Seed1.5-VL
多模态推理模型
字节跳动
分享至
打开微信扫一扫
内容投诉
生成图片
o3深度解读:OpenAI终于发力,agent产品危险了吗?
标题:o3深度解读:OpenAI发力,agent产品何去何从? OpenAI在2025年Q1推出的新模型o3表现惊艳,其融合的tool use能力覆盖了agent产品常用场景。o3和Manus代表了两类技术路线:一种是将tool use内化到模型中,另一种则是通过外置框架完成任务。OpenAI计划让...
虚拟织梦者
04-25 22:26:08
Agent产品
OpenAI
多模态推理
分享至
打开微信扫一扫
内容投诉
生成图片
Kimi 16B胜GPT-4o!开源视觉推理模型:MoE架构,推理时仅激活2.8B
标题:Kimi 16B胜GPT-4o!开源视觉推理模型:MoE架构,推理时仅激活2.8B 刚刚,Kimi团队发布全新开源轻量级视觉语言模型Kimi-VL及其推理版Kimi-VL-Thinking,兼具多模态和推理能力。该模型基于MoE架构,总参数16B,但推理时仅激活2.8B。 与Qwen2...
AI创想团
04-10 13:47:48
Kimi-VL
MoE架构
多模态推理
分享至
打开微信扫一扫
内容投诉
生成图片
阶跃星辰发布多模态推理模型Step-R1-V-Mini
8日,《科创板日报》报道,阶跃星辰正式推出多模态推理模型Step-R1-V-Mini。该模型支持图文输入与文字输出,具备优秀的指令遵循能力和通用性,可高精度识别图像并处理复杂推理任务。此模型的发布展示了阶跃星辰在多模态AI领域的技术突破,为相关应用提供了新的可能性。
AGI探路者
04-08 21:13:06
Step-R1-V-Mini
多模态推理模型
阶跃星辰
分享至
打开微信扫一扫
内容投诉
生成图片
开启多模态思考新时代:昆仑万维开源 R1V 视觉思维链推理模型
3月18日,昆仑万维正式开源国内首个工业级多模态思维链推理模型Skywork R1V。该模型支持视觉与文本的多模态推理,具备顶尖的逻辑推理和数学分析能力,在MATH500和AIME测试中分别获94.0和72.0分。Skywork R1V在视觉推理任务上表现出色,MMMU和MathVista基准得分达69和67.5。其核心技术包括文本推理向视觉任务的高效迁移、多模态混合式训练方法以及自适应长度思维链蒸馏,这些创新提升了模型的精度与泛化性能。模型权重及技术报告现已开源,分别可通过Hugging Face和GitHub获取。
智能视野
03-18 17:45:48
多模态推理模型
昆仑万维
视觉思维链
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序