专利 一种基于特定模态特征补偿的跨模态行人重识别方法

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210401883.1 (22)申请日 2022.04.18 (71)申请人西安电子科技大学地址 710071 陕西省西安市太白南路2号 (72)发明人张强　刘迦南　黄年昌　刘健　 (74)专利代理机构西安智大知识产权代理事务所 61215 专利代理师段俊涛 (51)Int.Cl. G06V 40/10(2022.01) G06V 20/52(2022.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称一种基于特定模态特征补偿的跨模态行人重识别方法 (57)摘要一种基于特定模态特征补偿的跨模态行人重识别方法，收集可见光行人图像作为可见光域训练图像，收集红外行人图像作为红外域训练图像；利用生成对抗网络将可见光域和红外域的行人图像进行风格转换，生成跨模态的配对行人图像；获取配对行人图像间的融合特征作为行人图像的表示特征用于行人重识别。本发明结合多模态图像风格转换网络和行人重识别，将一种模态的原始图像特征和其对应生成另一种模态图像特征融合作为行人图像特征；通过计算行人图像特征的欧式距离，根据欧式距离得到不同行人图像匹配的结果。本发明改善了生成图像的质量和配对图像融合特征的判别力，极大地提高了跨模态行人重识别任务的精度。权利要求书4页说明书8页附图2页 CN 115171148 A 2022.10.11 CN 115171148 A 1.一种基于特定模态特征补偿的跨模态行人重识别方法，其特征在于，包括：收集可见光行人图像作为可见光域训练图像，收集红外行人图像作为红外域训练图像；利用生成对抗网络将可见光域和红外域的行人图像进行风格转换，生成跨模态的配对行人图像；获取配对行人图像间的融合特征作为行人图像的表示特征用于行人重识别。 2.根据权利要求1所述基于特定模态特征补偿的跨模态行人重识别方法，其特征在于，对可见光和红外图片做相同的预处理操作：将输入图像每边添加宽度为l，值为0的像素点，并使用随机裁剪的方式得到相同的图片尺寸，之后随机水平翻转图片。 3.根据权利要求2所述基于特定模态特征补偿的跨模态行人重识别方法，其特征在于，所述预处理操作还包括：对可见光图像做灰度化处理。 4.根据权利要求1所述基于特定模态特征补偿的跨模态行人重识别方法，其特征在于，所述风格转换通过基于风格转换的生成网络和判别网络实现，包括：可见光域的行人图像输入生成网络，输出其对应的红外域的行人图像；红外域的行人图像输入生成网络，输出其对应的可见光域的行人图像。 5.根据权利要求4所述基于特定模态特征补偿的跨模态行人重识别方法，其特征在于，所述生成网络和判别网络采用生成对抗思想，包括一个可见光域到红外域的风格转换分支 BG2I和一个红外域到可见光域的风格转换分支BI2G，每个分支包括一个生成器和一个判别器，满足：其中， XG为可见光行人图像， XI为红外行人图像；表示红外行人图像与生成红外行人图像之间的对抗损失函数；表示可见光行人图像与生成可见光行人图像之间的对抗损失函数；表示判别器对真实红外行人图像的判别结果；表示判别器对真实可见光行人图像的判别结果； GG2I表示生成器将可见光行人图像作为输入进而获得新的红外行人图像； GI2G表示生成器将红外行人图像作为输入进而获得新的可见光行人图像；表示判别器对生成红外行人图像的判别结果；表示判别器对生成可见光行人图像的判别结果； LGAN表示和的对抗损失之和；生成网络和判别网络使用如下损失函数来训练： Lrecons||XG‑GI2G(XG)||1+||XI‑GG2I(XI)||1 Lcyc＝||XG‑GI2G[GG2I(XG)]||1+||XI‑GG2I[GI2G(XI)]||1 权　利　要　求　书 1/4 页 2 CN 115171148 A 2其中， Lrecons是定义可见光行人图像或红外行人图像与生成的可见光行人图像GI2G(XG) 或红外行人图像GG2I(XI)之间的重构损失函数； Lcyc是定义可见光行人图像或红外行人图像与生成的可见光行人图像GI2G[GG2I(XG)]或 GG2I[GI2G(XI)]之间的循环一致损失函数；和分别表示可见光行人图像和红外行人图像的身份损失函数， LID表示和的身份损失之和；和分别使用交叉熵损失函数作为可见光行人图像和红外行人图像的身份损失函数，其中，和分别是可见光行人图像和红外行人图像的预测得分， y是真实的行人身份标签； ||·||1表示L1范数；基于风格转换的生成网络和判别网络的目标函数L1为： L1＝LID+λ1Lrecons+λ2Lcyc+λ3Lgan 其中， λ1、 λ2和 λ3为加权系数。 6.根据权利要求5所述基于特定模态特征补偿的跨模态行人重识别方法，其特征在于，生成的跨模态的配对行人图像为和其中，表示可见光行人图像和其对应生成的红外行人图像，表示红外行人图像和其对应生成的可见光行人图像。 7.根据权利要求5所述基于特定模态特征补偿的跨模态行人重识别方法，其特征在于，所述融合特征为原始图像和生成图像的融合特征，通过基于注意力机制的配对图像特征融合方法获取，方法如下： (1)使用四个独立ResNet50提取到四种不同类型的特征FV、 FI和分别表示可见光行人图像特征、生成红外行人图像特征、红外行人图像特征和生成可见光行人图像特征；所述原始图像为可见光行人图像或红外行人图像，所述生成图像为红外行人图像或可见光行人图像； (2)当原始图像为可见光行人图像时， FV和首先经过两个通道注意力模块； EFV＝CAM(FV)＝wSV*FV， wSV＝σ(GAP(FV)+GMP(FV)) (3)EFV和分别经过两个卷积块后接着经过两个通道注意力模块； CFV＝ConvB(EFV, θ1)， FSV＝CAM(CFV)， (4)对FSV和求平均操作得到最终的行人图像融合特征；其中， EFV和表示增强后的可见光行人图像特征和生成红外行人图像特征； CAM(·)表示通道注意力模块， w(·)表示通道权重图， GAP( ·)和GMP(·)分别表示全局平均池化和全局最大池化； CFV和表示卷积后的可见光行人图像特征和生成红外行人图像特征；权　利　要　求　书 2/4 页 3 CN 115171148 A 3

专利 一种基于特定模态特征补偿的跨模态行人重识别方法

专利一种基于特定模态特征补偿的跨模态行人重识别方法