综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
正文:2025年12月,中国联通数据科学与人工智能研究院在AAAI 2026 (Oral)发表新研究HiMo-CLIP,突破长文本图像检索难题。该模型通过建模“语义层级”与“语义单调性”,自动捕捉语境中的“语义差异点”,显著提升长文本和组合性文本的检索精度,同时兼顾短文本性能。HiMo-CLIP采用层级分解模块(HiDe)和单调性感知对比损失(MoLo),动态提取关键特征并优化图文对齐机制。实验显示,仅用1M训练数据,HiMo-CLIP性能超越使用100M甚至10B数据的现有方法,并在自建数据集HiMo-Docci上取得SOTA结果。
原文链接
2025年11月,DeepSeek开源全新数学模型DeepSeekMath-V2,专注自验证数学推理,打破谷歌和OpenAI在该领域的垄断。该模型在IMO 2025、CMO 2024及Putnam 2024竞赛中表现卓越,尤其在Putnam中以118/120超越人类最高分90分,并在代数、几何、数论等CNML级别问题上全面领先GPT-5-Thinking-High和Gemini 2.5-Pro。DeepSeekMath-V2采用迭代强化学习循环优化证明生成与验证,首次实现完全自动化数据标注流程,显著提升模型能力。此模型由研究员邵智宏主导开发,他曾提出经典算法GRPO并参与多个重要项目。这一成果标志着开源AI在复杂数学推理领域的重要突破。
原文链接
正文:2025年11月,小米MiMo团队负责人罗福莉发布其加入小米后的首篇论文,开源全球首个跨具身智能与自动驾驶的基础模型MiMo-Embodied。该模型基于MiMo-VL架构,通过整合通用视觉、具身任务及驾驶场景数据,并采用四阶段训练策略,成功打破室内操作与户外驾驶的领域鸿沟。在29个基准测试中,MiMo-Embodied全面领先,涵盖自动驾驶感知、规划及机器人导航等任务。实验显示,模型在复杂交互场景和真实驾驶任务中表现卓越。罗福莉曾任职于阿里巴巴达摩院和DeepSeek,而项目负责人陈龙为小米智驾首席科学家,此前在Wayve和Lyft主导相关研发。
原文链接
11月19日,小米公关部总经理王化宣布,2025小米人车家全生态合作伙伴大会将于12月17日举办。届时,新加入小米的MiMo大模型负责人罗福莉将首次公开亮相。罗福莉为“95后”,本科毕业于北京师范大学计算机专业,硕士毕业于北京大学计算语言学专业。她曾任职于阿里巴巴达摩院,主导开发多语言预训练模型VECO,并推动AliceMind开源;2022年加入DeepSeek,参与研发MoE大模型DeepSeek-V2。此次大会或将成为小米AI技术布局的重要展示平台。
原文链接
正文:谷歌DeepMind团队在Nature上公开了其IMO金牌模型AlphaProof的技术细节。核心团队仅10人,开发历时一年,生成8000万道数学题用于AI训练。AlphaProof基于Lean定理证明器构建强化学习环境,将数学证明过程转化为游戏关卡,使用30亿参数的Transformer模型作为核心,并结合改进的树搜索算法。2024年IMO比赛中,AlphaProof成功解决三道难题(包括最难的P6),最终夺得金牌。系统通过测试时强化学习生成变体问题并进行针对性训练,展现了强大的解题能力。尽管依赖Lean定理证明器且在处理全新定义时存在局限性,但其反证功能和形式化能力受到数学家高度评价。谷歌已开放AlphaProof供科研使用。
原文链接
10月30日,英伟达持仓公司CoreWeave宣布收购AI开发平台Marimo,旨在整合生成式AI开发者的工作流程。此次收购将进一步提升CoreWeave在AI领域的技术能力与市场竞争力,但具体交易条款尚未披露。这一动态体现了AI行业持续整合与创新的趋势,为开发者提供更高效的工具和平台支持。
原文链接
9月19日,小米宣布开源首个原生端到端语音大模型Xiaomi-MiMo-Audio,首次在语音领域实现基于ICL的少样本泛化。该模型通过创新预训练架构和上亿小时数据,在自然度、情感表达和交互适配方面达到拟人化水准。其突破性创新包括:证明语音无损压缩预训练可“涌现”跨任务泛化性,并开源完整语音预训练方案,包括Tokenizer、模型结构等。目前,模型已在Huggingface和Github平台开源,参数量达1.2B,支持音频重建和音频转文本任务。
原文链接
2025年8月,OpenAI宣布重大权力结构调整,CEO Sam Altman将日常运营交由5月任命的应用业务CEO Fidji Simo负责。Altman表示难以同时管理消费科技、超级基建、前沿研究等多领域,未来将聚焦万亿美元级融资、超级计算项目及脑机接口创业公司等前瞻性布局。Simo曾任职Facebook和Instacart,拥有丰富商业化经验,目标是将OpenAI从初创公司转型为上市科技巨头。她将领导ChatGPT等消费应用的商业化,并探索新产品如浏览器及购物搜索结果中的联盟链接变现模式。此次调整标志OpenAI从非营利研究机构向硅谷典型科技企业转型。
原文链接
2025年8月,字节发布全新数学模型Seed-Prover,在复杂数学问题解决领域取得突破性进展。该模型基于Lean 4形式化推理框架,并创新采用引理式证明范式,模块化处理数学推理过程。其在MiniF2F数据集上实现100%正确率,解决了78.1%的历年IMO难题,并在普特南数学竞赛中表现优异。此外,Seed-Prover集成专用几何推理引擎Seed-Geometry,在IMO 2025比赛中达到银牌水准,完整解决6道题中的4道及部分证明。Seed-Geometry还在2秒内解出IMO 2025第2题,展现了卓越效率和泛化能力。前谷歌成员Deedy Das评价称,字节是唯一一家为IMO发表完整论文的AI实验室。
原文链接
2025年,OpenAI的IMO金牌团队揭示其背后仅由三名核心开发者组成:Alexander Wei、Sheryl Hsu和Noam Brown,项目在竞赛前两三个月突击完成。模型成功攻克IMO难题被视为AI数学能力的重要里程碑,但在第六题上选择‘不作答’,显示出对自身能力边界的清晰认知。团队表示,这种行为避免了‘一本正经地胡说八道’,是AI的一大进步。此外,他们认为解决千禧年大奖难题仍遥不可及,因从1.5小时到数万小时思考时间的跨越难度极高。未来,团队计划将相关技术应用于更广泛的推理领域,并探索让AI学会‘提出问题’的能力。模型或开放供数学家使用,但具体细节仍在研究中。
原文链接
加载更多
暂无内容