1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:北大彭宇新团队提出TARA方法,破解生物分层识别难题

正文:
一张蓝锥嘴雀的图片,普通人能认出它是“鸟”,但很难精准定位到“鸟纲-雀形目-唐纳雀科-锥嘴雀属-蓝锥嘴雀”。现有的多模态大模型也面临类似问题。真实世界中的对象通常具有复杂的类别层次(如界-门-纲-目-科-属-种),而现有模型在分层视觉识别任务中,难以从粗到细实现每一层的精准识别。

北京大学彭宇新教授团队提出了一种名为分类感知表征对齐方法(TARA)的新技术,通过将生物基础模型的类别树知识注入多模态大模型,显著提升了分层视觉识别能力。该研究已被CVPR 2026接收,并已开源。

背景与挑战

现有多模态大模型在细粒度视觉识别上表现良好,但在分层视觉识别任务中存在三大挑战:
1. 同层判别性差:粗粒度类别类内差异大,细粒度类别类间差异小,模型难以区分相似类别。
2. 跨层一致性差:缺乏类别树知识,模型预测结果常违反父子节点关系。例如,“鹦鹉目”不应对应“裸鼻雀科”。
3. 新类泛化性差:模型忽略类别共性,难以识别未见过的新物种。

技术方案

TARA方法通过两步实现类别树知识的注入:
1. 分层视觉表征对齐:将大模型中间层与生物基础模型的视觉表征对齐,提取完整类别树结构的视觉特征。
2. 自由粒度类别表征对齐:对齐大模型输出答案的首个词元表征与生物基础模型的真实类别表征,确保模型能根据指定层次生成对应类别名称。

在训练阶段,采用强化微调和对齐损失优化模型;推理时,仅需优化后的大模型即可完成识别。

实验结果

实验表明,TARA方法在iNaturalist-Plant、iNaturalist-Animal等数据集上显著提升了分层视觉识别准确率,尤其在新物种识别任务中表现优异。这些新物种样本稀少,甚至可能是科学界尚未描述的新物种,传统模型难以处理。

项目价值

TARA方法通过引入类别树先验,增强了多模态大模型的分层视觉识别能力,解决了从粗到细精准识别的难题,为生物分类学研究提供了重要工具。

论文链接:https://arxiv.org/abs/2603.00431
开源代码:https://github.com/PKU-ICST-MIPL/TARA_CVPR2026

原文链接
本文链接:https://kx.umi6.com/article/34015.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
精准识别「界门纲目科属种」!北大彭宇新团队用细粒度树先验提升泛化,破解生物类别分层识别难题
2026-03-21 18:30:50
阿里宣布AI战略商业目标:未来五年,云和AI商业化收入突破1000亿美元
2026-03-19 20:26:37
数据显示 生成式AI应用去年向苹果支付了近9亿美元的订阅分成
2026-03-19 17:17:48
浙江省省长刘捷:希望广大企业持续加大科技投入 打造人工智能创新发展高地
2026-03-20 17:55:04
龙虾也能当导演了!LibTV解锁全自动拍片,一句话从剧本干到成片
2026-03-20 18:53:50
阿里巴巴:百炼MaaS平台Token消耗3个月升6倍 将成阿里云最大收入产品
2026-03-19 20:31:44
西门子投资1.65亿美元扩大美国人工智能制造业务
2026-03-20 18:58:10
小米:未来三年 AI领域计划投入至少600亿元
2026-03-19 21:39:18
首个国家级AI+影像识别专业赛事正式启动
2026-03-19 17:16:52
斯洛伐克首次迎来无人驾驶,文远知行全球版图扩至十二国
2026-03-19 19:20:43
黄仁勋:每一家工业企业都将成为机器人公司!连发物理AI全家桶
2026-03-20 09:10:54
耀客AI艺人遭全网吐槽 撞脸多位明星
2026-03-20 18:55:59
同事群里催催催,龙虾自动回回回!刚发布的「飞书龙虾」把我解脱了
2026-03-19 19:21:55
24小时热文
更多
扫一扫体验小程序