多模态大模型 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

企业级OpenClaw最强拍档来了！万亿参数的国产多模态大模型，刚刚开源发布

正文：2026年3月5日，YuanLab.ai团队正式开源发布万亿参数规模的多模态大模型‘源Yuan3.0 Ultra’。作为当前业界仅有的三个万亿级开源多模态模型之一，该模型采用统一多模态架构和混合专家（MoE）设计，通过LAEP算法优化参数至1010B，预训练效率提升49%。其在复杂文档理解、多源信息检索与整合、数据分析等企业级任务中表现突出，超越Claude Opus、Gemini Pro等前沿模型。此外，模型引入Localized Filtering Attention机制，强化语义关系建模能力，并提出Fast-thinking强化学习范式，显著提升推理效率。Yuan3.0 Ultra已全面开源，支持社区二次开发，旨在推动大模型从能力展示走向规模化落地，为企业Agent应用提供深度优化的解决方案。

原文链接

未来笔触

03-05 19:45:14

Yuan3.0 Ultra

多模态大模型

开源

分享至

打开微信扫一扫

内容投诉

生成图片

中国第一，全球第二，视频大模型领军者生数科技完成超 6 亿元A+轮融资

2月5日，生数科技宣布完成超6亿元人民币A+轮融资，由中关村科学城公司和星连资本领投，多家机构跟投。其多模态大模型Vidu在国际权威榜单中排名中国第一、全球第二，超越Runway Gen-4.5、Google Veo3.1等知名模型。Vidu于2024年7月全球上线，首创“参考生视频”技术，解决多主体连续一致性难题，并以全球最快生成速度领先行业。2025年12月，生数科技开源TurboDiffusion框架，将视频生成效率提升100-200倍。目前，Vidu已成为全球内容创作者及企业首选工具，2025年实现用户与收入超10倍增长，赋能广告、影视、教育等多个行业。

原文链接

月光编码师

02-06 17:02:51

Vidu

多模态大模型

生数科技

分享至

打开微信扫一扫

内容投诉

生成图片

重构AI在数字和物理世界的生产力，生数科技完成超6亿元A+轮融资

2026年2月5日，生数科技宣布完成超6亿元人民币A+轮融资，由中关村科学城公司和星连资本领投，万兴科技、视觉中国等战略投资。公司成立于2023年3月，专注于多模态通用大模型研发，其核心产品Vidu于2024年7月上线，首创“参考生视频”技术，解决商业视频生成难题，并在速度上领先OpenAI Sora等竞品10倍以上。2025年12月，生数科技开源TurboDiffusion框架，将视频生成效率提升100-200倍。目前，Vidu已成全球内容创作者及企业首选工具，用户和收入实现10倍增长。CEO骆怡航表示，公司将推动多模态大模型成为新一代生产力，重构内容生产与交互体验。创始人朱军强调，未来将持续探索AI在物理世界的应用价值。

原文链接

蝶舞CyberSwirl

02-06 03:28:59

Vidu

多模态大模型

生数科技

分享至

打开微信扫一扫

内容投诉

生成图片

精准锁定「硬骨头」：难样本筛选破局SFT依赖，GRPO-only斩获感知推理双最优

精准锁定「硬骨头」：难样本筛选破局SFT依赖，GRPO-only斩获感知推理双最优中兴通讯AIM团队投稿量子位 | 公众号 QbitAI 一项被AAAI 2026接收的研究，针对多模态大模型后训练的难题提出全新解决方案。研究发现，在视觉推理与感知任务中，仅用中等和困难样本训练、完全跳过SFT...

原文链接

数据炼金师

11-28 12:26:14

GRPO-only

多模态大模型

难度感知采样

分享至

打开微信扫一扫

内容投诉

生成图片

大模型首次拥有“脖子”！纽大团队实现360度类人视觉搜索

大模型首次拥有“脖子”！纽大团队实现360度类人视觉搜索纽约大学研究团队在论文《Thinking in 360°: Humanoid Visual Search in the Wild》中，提出了一种全新的“类人视觉搜索”（Humanoid Visual Search, HVS）任务，让大模型能够...

原文链接

数字墨迹

11-27 16:44:41

360度全景

多模态大模型

类人视觉搜索

分享至

打开微信扫一扫

内容投诉

生成图片

王兴兴透露：宇树机器人已能完成绝大部分工作动作

2025年11月16日，宇树科技创始人兼CEO王兴兴在“2025人工智能+大会”上透露，宇树研发的人形机器人已能完成绝大部分工作动作，包括离线预学习和实时模仿复刻。他预测，未来十年内，AI技术将赋予机器人“理解世界”的能力，并通过多模态大模型与机器人的深度融合，使其更加敏锐和高效。(财联社、上证报)

原文链接

数据炼金师

11-16 15:42:36

AI技术

多模态大模型

宇树机器人

分享至

打开微信扫一扫

内容投诉

生成图片

阶跃星辰 CEO 姜大昕：智能终端可能成为未来的 AI 入口

2025年11月16日，阶跃星辰创始人兼CEO姜大昕在2025人工智能+大会上表示，智能终端可能成为未来AI入口，并看好智能硬件在‘人・车・家’领域的应用。他指出，随着智能驾驶技术发展，汽车将成为人类的‘第三生活空间’，支持娱乐交互。阶跃星辰已布局汽车AI产品，如今年7月发布的下一代智能座舱Agent OS预览版，融合多模态大模型与端云一体技术，提供超自然交互、全融合地图导航及个性化记忆功能，为用户带来拟人化、情感化的座舱体验，推动AI与生活的深度融合。

原文链接

智能维度跳跃

11-16 15:39:12

AI入口

多模态大模型

智能终端

分享至

打开微信扫一扫

内容投诉

生成图片

我国发布全球首个深海生境智能多模态大模型

11月6日，在厦门举办的2025国际海洋周开幕式上，我国发布全球首个深海生境智能多模态大模型——“深海生境智能认知与探索多模态大模型”。该模型由中国大洋事务管理局指导、多家科研机构联合研发，是联合国“海洋十年”计划的重要成果，具备深海智能感知、全域推演、治理决策生成及沉浸式导览功能，目前已完成对一座深海海山和一处热液区的认知系统构建。未来，模型将向全球科研机构开放，扩展覆盖深海多种生境。同时，《APEC海洋可持续发展报告》也在会上发布，首次提出“五位一体”框架，为亚太海洋可持续发展提供科学支持。

原文链接

QuantumHacker

11-06 21:14:23

多模态大模型

智能认知

深海生境

分享至

打开微信扫一扫

内容投诉

生成图片

抖音集团旗下巨量引擎首次披露AI广告治理自研大模型

10月26日，在第32届中国国际广告节期间，抖音集团旗下巨量引擎首次公开了其在AI广告治理领域的自研多模态大模型。该模型是其“全链路治理+以AI治AI”广告安全策略的核心技术支撑，可实现90%的素材在10分钟内完成审核。今年第三季度，巨量引擎已前置拦截84万余个涉AI广告违规素材，显著提升了广告风险治理效率。这一技术突破为行业提供了高效解决方案，并展示了AI在内容安全领域的应用潜力。

原文链接

蝶舞CyberSwirl

10-26 21:29:49

AI广告治理

巨量引擎

自研多模态大模型

分享至

打开微信扫一扫

内容投诉

生成图片

多模态大模型学会反思和复盘，上交&上海AI Lab破解多模态复杂推理

标题：多模态大模型学会反思，上交&上海AI Lab突破复杂推理正文：多模态大模型虽表现惊艳，但常因缺乏“反思”能力而受困。无论是生成代码还是分析图表，它们倾向于直接给出答案，却难以在复杂问题中纠错。这种短板阻碍了AI从“知识容器”向“问题解决大师”的进化。上海交通大学与上海人工...