多模态推理模型

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

叫板谷歌！马斯克xAI发布Grok-4-Fast 性能比肩Gemini 2.5

9月21日，马斯克旗下xAI公司发布新型多模态推理模型Grok-4 Fast，性能媲美行业领先水平。该模型支持高达2M上下文窗口，具备强大的复杂任务处理能力，并与X平台深度集成，可解析帖子、提供链接及关联YouTube视频。其采用强化学习训练，能自主调用外部工具，搭载智能搜索引擎，实时浏览网页和X平台内容，整合多模态信息并输出分析结果。目前，Grok-4 Fast已向所有用户开放，并在Auto模式下自动处理复杂查询。此外，xAI还推出grok-4-fast-reasoning和grok-4-fast-non-reasoning两款新模型，现已通过API开放使用。

原文链接

Journeyman

09-21 16:46:00

Grok-4-Fast

xAI公司

多模态推理模型

分享至

打开微信扫一扫

内容投诉

生成图片

WAIC 2025｜阶跃发布新一代基模 Step 3：原生多模态，推理效率行业领先

2025世界人工智能大会前夕，阶跃星辰于7月25日在上海发布新一代基础大模型Step 3，主打原生多模态与行业领先的推理效率，将于7月31日开源。该模型采用MoE架构，参数量达321B，在MMMU等榜单中取得开源多模态推理模型的最优成绩。阶跃星辰联合多家芯片厂商发起“模芯生态创新联盟”，推动全产业链协同创新，并与上海国投达成深度战略合作，加速大模型应用落地。目前，Step 3已适配华为昇腾等芯片，广泛应用于手机、汽车及金融等领域。

原文链接

AGI探路者

07-25 22:30:52

Step 3

多模态推理模型

模芯生态创新联盟

分享至

打开微信扫一扫

内容投诉

生成图片

拿下38项第一！字节发布Seed1.5-VL多模态推理模型

标题：字节发布Seed1.5-VL多模态推理模型：轻量高效，表现卓越正文：在60项主流基准测试中，字节发布的轻量级多模态推理模型Seed1.5-VL拿下了38项第一。该模型仅包含532M视觉编码器和200亿参数，却能在复杂谜题推理、OCR、图表理解及3D空间理解等方面媲美更大规模的顶级模型。例如...

原文链接

蝶舞CyberSwirl

05-14 15:15:44

Seed1.5-VL

多模态推理模型

字节跳动

分享至

打开微信扫一扫

内容投诉

生成图片

阶跃星辰发布多模态推理模型Step-R1-V-Mini

8日，《科创板日报》报道，阶跃星辰正式推出多模态推理模型Step-R1-V-Mini。该模型支持图文输入与文字输出，具备优秀的指令遵循能力和通用性，可高精度识别图像并处理复杂推理任务。此模型的发布展示了阶跃星辰在多模态AI领域的技术突破，为相关应用提供了新的可能性。

原文链接

AGI探路者

04-08 21:13:06

Step-R1-V-Mini

多模态推理模型

阶跃星辰

分享至

打开微信扫一扫

内容投诉

生成图片

开启多模态思考新时代：昆仑万维开源 R1V 视觉思维链推理模型

3月18日，昆仑万维正式开源国内首个工业级多模态思维链推理模型Skywork R1V。该模型支持视觉与文本的多模态推理，具备顶尖的逻辑推理和数学分析能力，在MATH500和AIME测试中分别获94.0和72.0分。Skywork R1V在视觉推理任务上表现出色，MMMU和MathVista基准得分达69和67.5。其核心技术包括文本推理向视觉任务的高效迁移、多模态混合式训练方法以及自适应长度思维链蒸馏，这些创新提升了模型的精度与泛化性能。模型权重及技术报告现已开源，分别可通过Hugging Face和GitHub获取。

原文链接