综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
标题:ReCALL框架化解生成式与判别式冲突,大模型检索性能全面超越SOTA|CVPR’26
正文:
生成式大模型在图像检索任务中常因范式冲突导致能力退化,这一难题如今被紫东太初团队与新加坡国立大学联合攻克。他们的最新成果ReCALL框架通过“诊断-生成-校准”闭环体系,解决了生成式到判别式的适...
原文链接
标题:北大王选所彭宇新团队:让多模态大模型学会「看懂物种关系」丨CVPR 2026
近年来,多模态大模型在视觉理解任务中表现优异,但在层级视觉识别中仍存在不足。例如,生物分类体系中的“界—门—纲—目—科—属—种”等层级结构需要模型理解类别间的语义关系,而现有模型常因扁平分类框架导致层级冲突或路径...
原文链接
正文:2026年3月5日,YuanLab.ai团队正式开源发布万亿参数规模的多模态大模型‘源Yuan3.0 Ultra’。作为当前业界仅有的三个万亿级开源多模态模型之一,该模型采用统一多模态架构和混合专家(MoE)设计,通过LAEP算法优化参数至1010B,预训练效率提升49%。其在复杂文档理解、多源信息检索与整合、数据分析等企业级任务中表现突出,超越Claude Opus、Gemini Pro等前沿模型。此外,模型引入Localized Filtering Attention机制,强化语义关系建模能力,并提出Fast-thinking强化学习范式,显著提升推理效率。Yuan3.0 Ultra已全面开源,支持社区二次开发,旨在推动大模型从能力展示走向规模化落地,为企业Agent应用提供深度优化的解决方案。
原文链接
2月5日,生数科技宣布完成超6亿元人民币A+轮融资,由中关村科学城公司和星连资本领投,多家机构跟投。其多模态大模型Vidu在国际权威榜单中排名中国第一、全球第二,超越Runway Gen-4.5、Google Veo3.1等知名模型。Vidu于2024年7月全球上线,首创“参考生视频”技术,解决多主体连续一致性难题,并以全球最快生成速度领先行业。2025年12月,生数科技开源TurboDiffusion框架,将视频生成效率提升100-200倍。目前,Vidu已成为全球内容创作者及企业首选工具,2025年实现用户与收入超10倍增长,赋能广告、影视、教育等多个行业。
原文链接
2026年2月5日,生数科技宣布完成超6亿元人民币A+轮融资,由中关村科学城公司和星连资本领投,万兴科技、视觉中国等战略投资。公司成立于2023年3月,专注于多模态通用大模型研发,其核心产品Vidu于2024年7月上线,首创“参考生视频”技术,解决商业视频生成难题,并在速度上领先OpenAI Sora等竞品10倍以上。2025年12月,生数科技开源TurboDiffusion框架,将视频生成效率提升100-200倍。目前,Vidu已成全球内容创作者及企业首选工具,用户和收入实现10倍增长。CEO骆怡航表示,公司将推动多模态大模型成为新一代生产力,重构内容生产与交互体验。创始人朱军强调,未来将持续探索AI在物理世界的应用价值。
原文链接
精准锁定「硬骨头」:难样本筛选破局SFT依赖,GRPO-only斩获感知推理双最优
中兴通讯AIM团队投稿
量子位 | 公众号 QbitAI
一项被AAAI 2026接收的研究,针对多模态大模型后训练的难题提出全新解决方案。研究发现,在视觉推理与感知任务中,仅用中等和困难样本训练、完全跳过SFT...
原文链接
大模型首次拥有“脖子”!纽大团队实现360度类人视觉搜索
纽约大学研究团队在论文《Thinking in 360°: Humanoid Visual Search in the Wild》中,提出了一种全新的“类人视觉搜索”(Humanoid Visual Search, HVS)任务,让大模型能够...
原文链接
2025年11月16日,宇树科技创始人兼CEO王兴兴在“2025人工智能+大会”上透露,宇树研发的人形机器人已能完成绝大部分工作动作,包括离线预学习和实时模仿复刻。他预测,未来十年内,AI技术将赋予机器人“理解世界”的能力,并通过多模态大模型与机器人的深度融合,使其更加敏锐和高效。(财联社、上证报)
原文链接
2025年11月16日,阶跃星辰创始人兼CEO姜大昕在2025人工智能+大会上表示,智能终端可能成为未来AI入口,并看好智能硬件在‘人・车・家’领域的应用。他指出,随着智能驾驶技术发展,汽车将成为人类的‘第三生活空间’,支持娱乐交互。阶跃星辰已布局汽车AI产品,如今年7月发布的下一代智能座舱Agent OS预览版,融合多模态大模型与端云一体技术,提供超自然交互、全融合地图导航及个性化记忆功能,为用户带来拟人化、情感化的座舱体验,推动AI与生活的深度融合。
原文链接
11月6日,在厦门举办的2025国际海洋周开幕式上,我国发布全球首个深海生境智能多模态大模型——“深海生境智能认知与探索多模态大模型”。该模型由中国大洋事务管理局指导、多家科研机构联合研发,是联合国“海洋十年”计划的重要成果,具备深海智能感知、全域推演、治理决策生成及沉浸式导览功能,目前已完成对一座深海海山和一处热液区的认知系统构建。未来,模型将向全球科研机构开放,扩展覆盖深海多种生境。同时,《APEC海洋可持续发展报告》也在会上发布,首次提出“五位一体”框架,为亚太海洋可持续发展提供科学支持。
原文链接
加载更多
暂无内容