精准识别「界门纲目科属种」！北大彭宇新团队用细粒度树先验提升泛化，破解生物类别分层识别难题 - AI优秘圈

1

免责声明：Al优秘圈所有资讯仅代表作者个人观点，不构成任何投资理财建议。请确保访问网址为（kx.umi6.com) 投诉及建议

7*24小时快讯

AI科普

合作

扫一扫体验小程序

小杨哥

个人资料

曝光推广

客户留言

投诉及建议

退出登录

×

7*24小时快讯 AI科普合作

2026-03-21 18:30:50

精准识别「界门纲目科属种」！北大彭宇新团队用细粒度树先验提升泛化，破解生物类别分层识别难题

心智奇点

发布在

科普

阅读：260

标题：北大彭宇新团队提出TARA方法，破解生物分层识别难题

正文：
一张蓝锥嘴雀的图片，普通人能认出它是“鸟”，但很难精准定位到“鸟纲-雀形目-唐纳雀科-锥嘴雀属-蓝锥嘴雀”。现有的多模态大模型也面临类似问题。真实世界中的对象通常具有复杂的类别层次（如界-门-纲-目-科-属-种），而现有模型在分层视觉识别任务中，难以从粗到细实现每一层的精准识别。

北京大学彭宇新教授团队提出了一种名为分类感知表征对齐方法（TARA）的新技术，通过将生物基础模型的类别树知识注入多模态大模型，显著提升了分层视觉识别能力。该研究已被CVPR 2026接收，并已开源。

背景与挑战

现有多模态大模型在细粒度视觉识别上表现良好，但在分层视觉识别任务中存在三大挑战：
1. 同层判别性差：粗粒度类别类内差异大，细粒度类别类间差异小，模型难以区分相似类别。
2. 跨层一致性差：缺乏类别树知识，模型预测结果常违反父子节点关系。例如，“鹦鹉目”不应对应“裸鼻雀科”。
3. 新类泛化性差：模型忽略类别共性，难以识别未见过的新物种。

技术方案

TARA方法通过两步实现类别树知识的注入：
1. 分层视觉表征对齐：将大模型中间层与生物基础模型的视觉表征对齐，提取完整类别树结构的视觉特征。
2. 自由粒度类别表征对齐：对齐大模型输出答案的首个词元表征与生物基础模型的真实类别表征，确保模型能根据指定层次生成对应类别名称。

在训练阶段，采用强化微调和对齐损失优化模型；推理时，仅需优化后的大模型即可完成识别。

实验结果

实验表明，TARA方法在iNaturalist-Plant、iNaturalist-Animal等数据集上显著提升了分层视觉识别准确率，尤其在新物种识别任务中表现优异。这些新物种样本稀少，甚至可能是科学界尚未描述的新物种，传统模型难以处理。

项目价值

TARA方法通过引入类别树先验，增强了多模态大模型的分层视觉识别能力，解决了从粗到细精准识别的难题，为生物分类学研究提供了重要工具。

论文链接：https://arxiv.org/abs/2603.00431
开源代码：https://github.com/PKU-ICST-MIPL/TARA_CVPR2026

原文链接

本文链接：https://kx.umi6.com/article/34015.html

转载请注明文章出处

分层视觉识别

类别树结构

细粒度视觉识别

分享至

打开微信扫一扫

内容投诉

生成图片

心智奇点

639 文章

450858 浏览

阅读更多

24小时热文

更多

库克称不要惧怕要拥抱AI

2026-03-21 19:37:28
精准识别「界门纲目科属种」！北大彭宇新团队用细粒度树先验提升泛化，破解生物类别分层识别难题

2026-03-21 18:30:50
英伟达GTC现场的隐形AI巨头：老黄机器人demo背后都是它

2026-03-21 18:29:21

扫一扫体验小程序