导读

原文:openaccess.thecvf.com/content_CVP…

代码:暂无

经过行人的特点来进行reid是现在干流的办法之一,什么是特点信息? 衣服色彩、头发、背包等根据物理外观的信息。特点并非预先定义作为辅佐练习,是经过分顶中底层提取部分特征的方式让网络学习到该区域的特点,用于后续的辅佐猜测。 本文将注意力机制和特点信息结合,运用图画的大局信息、部分信息、特点信息完结行人重辨认。

简介

本文提出了一个新的体系结构——特点注意网络(AANet),此分类结构能够将人的特点和特点注意力承继到一个分类框架中,以此来解决重辨认问题。

【论文阅读】AANet: Attribute Attention Network for Person Re-Identifications
热图对应6种特点,如头发、上衣色彩、下身色彩等。

办法

本文的办法主要有三个部分组成,别离是大局特征网络(GFN),根据输入查询图画进行大局身份(ID)分类;部分特征网络(PFN),专心于部分特征的检测;第三种是特点特征网络(AFN),从人员特点中提取类感知区域,生成特点注目的。

【论文阅读】AANet: Attribute Attention Network for Person Re-Identifications

每个部分都需要用到resnet50来抽取特征,用这些特征作为输入。

大局特征网络GFN

从Resnet50抽取的特征经过一层大局池化后顺次经过111 \times 1卷积层、批量归一化和Relu,最终经过softmaxsoftmax线性改变。(图中的z、v、c别离是每次改变后的通道数)。用穿插熵作为丢失函数。

部分特征网络PFN

身体部分检测器将特征映射成六个水平部分,并估量相应的感兴趣区域。被区分的之后的部分会进行类似与GFN那样的操作。

【论文阅读】AANet: Attribute Attention Network for Person Re-Identifications

特点特征网络AFN

AFN是本文办法的要害,其包含了两个子任务,一个是特点分类(AC),另一个是特点注意力求生成(AAM)。第一个子任务对个体特点进行分类。第二个子任务运用第一个子任务的输出,并为每个特点生成类激活映射(CAM)。

CAM是什么?

Learning Deep Features for Discriminative Localization,2016 CVPR

是一种即便网络仅在图画级标签上练习也能定位区分图画区域的技能

特点分类AC

在DuketMTMC-reID和Market1501上别离有10和12个带注释的特点。AFN的第一层是1×1卷积,它将特征图X的通道深度从Z减小到v。接下来,我们将特征图区分为三个不同的调集,别离是Top、Middle和Bottom特征图,每个特征图负责从各自的部分区域提取特征根据部分的建模能够削减背景杂波,提高分类精度。不同的部分重视不同的特点。例如,Top特征地图用于捕捉帽子、头发、袖子和上衣色彩等特征。来自身体下半部分的特征在Top特征图中被忽略。如图5所示,将这些特征图的输出与大局特征图进行平均汇聚,在v层发生4个特征向量。这4个向量是全连接层c的输入。在Market1501上,C层有4个分类器,每个分类器生成自己的特点猜测。

【论文阅读】AANet: Attribute Attention Network for Person Re-Identifications

特点注目的AAM

此部分的输入是ac的输出。AAM结合了来自单个特点的类敏感激活区域。运用CAM从每个人特点提取这些独自的类敏感激活区域。如前所述,CAM运用GAP,经过少许调整,生成带有判别特征的图画区域。因此,CAM的输出显示了表明该特点的图画区域。经过最大值操作兼并各个类别特定的激活区,并执行自适应阈值,阈值进程去除了有时出现在类特点激活区内的一些背景区域。AAM在定位特点信息不同的区域时更具特异性。

【论文阅读】AANet: Attribute Attention Network for Person Re-Identifications

丢失定义

丢失函数为:

【论文阅读】AANet: Attribute Attention Network for Person Re-Identifications
其中Lg、Lp、La、LaaL_{g}、L_{p}、L_{a}、L_{aa}别离代表大局、部分、特点、特点注意力丢失。 g、p、a、aa_{g}、_{p}、_{a}、_{aa}别离代表大局、部分、特点、特点注意力的噪声。

实验结果

【论文阅读】AANet: Attribute Attention Network for Person Re-Identifications