国家标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210658670.7 (22)申请日 2022.06.12 (71)申请人 西北工业大 学 地址 710072 陕西省西安市友谊西路127号 (72)发明人 张世周 高一涛  (74)专利代理 机构 西安凯多 思知识产权代理事 务所(普通 合伙) 61290 专利代理师 刘涛 (51)Int.Cl. G06V 20/52(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06V 10/764(2022.01) G06V 10/774(2022.01) G06V 10/82(2022.01) (54)发明名称 一种基于残差单元结构搜索的行人重识别 方法 (57)摘要 本发明公开了一种基于残差单元结构搜索 的行人重识别方法, 包含两部分, 第一部分为对 行人图片信息的提取和编码过程, 第二部分为基 于三元组损失对待检索行人图片实现检索和排 序; 在第一部分中, 预定义了一个具有上下两个 支路的搜索空间, 其中, 上支路通过行人全局粗 粒度信息来引导网络结构的搜索, 下支路则是以 更细粒度的局部身体信息来配合整体信息引导 网络结构搜索, 使得搜索过程能够更关注行人的 细节特征。 使用交叉熵损失和三元组损失函数, 实现了不同行人的检测和排序。 本发 明鼓励搜索 算法去学习更丰富的细节性信息来引导神经网 络结构搜索的方向, 提高识别度。 权利要求书3页 说明书11页 附图2页 CN 115131727 A 2022.09.30 CN 115131727 A 1.一种基于残差单 元结构搜索的行 人重识别方法, 其特 征在于, 包括如下步骤: 步骤1: 构建行 人重识别网络; 步骤1‑1: 将待分类图片、 与待分类图片同类别的图片即正样本和不同类别的行人图片 即负样本组成一个三元组, 经3 ×3大小的卷积预 处理后分别输入行人重识别网络的上支路 P1和下支路P2, 上支路P1用于提取粗粒度特 征, 下支路P2用于提取细粒度特 征; 步骤1‑2: 上支路P1和下支路P2都由4个Block构成, 并共享前三个Block; 在最后一个 Block中, 上支路P1和下支路P2分别拥有各自的架构参数和 模型参数; 将上支路P1中的4个 Block按顺序记为P1=[B1,B2,B3,B4], 下支路P2中的4个Bl ock记为P2=[B1,B2,B3,B5]; 步骤1‑3: 每个Block由若干个单元依次堆叠构成, 五个Block对应的单元堆叠层 数记为 b=[b1,b2,b3,b4,b5], 其中b1,b2,b3,b4,b5分别表示每个Block中包含的单元数量; 上支路P1 中第4个Block的第一层单元使用命名为Res_Reduction  Cell的残差减半单元, 其余层单元 使用命名为Res_Normal  Cell的残差正常单元; 下支路P2的第4个Block中堆叠的单元则全 部使用Res_N ormal Cell; 步骤1‑4: 残差正常单元由N个节点构成的有向无环图, 前两个节点为输入节点, 顺次的 N‑3个节点为中间节 点, 最后一个节点为输出节点, 残差的直连通道由输入节 点直接与中间 三个节点级联后的结果 求和; 输出用下式计算: 其中, concat( ·)表示级联操作, 该操作将中间节点的特征图在通道维进行拼接, h (·)将上一层单 元的输出直接映射到 本层输出之中; 表示节点, i =0,1,…,N; 残差减半单元Res_Reduction  Cell是在残差正常单元Res_Normal  Cell中增加一个 stride为2的卷积层, 使输出 特征图的宽和高减半, 通道维度增 加一倍; 步骤1‑5: 对于残差正常单元cellk的第j个中间节点 其与来自于第i个前继节点 i<j之间的连接用下式表示: 式中, 定义了节点 和节点 之间的连接边上选择候选神经操作om时对应的混合 权重参数; Ci,j表示0/1通道掩码, 掩码中1对应的通道被选定用于神经操作运算, 而0对应的 通道被屏蔽; 候选神经操作om有以下|O|=8种情况: ◆o1、 o2: 3×3和5×5的深度可分离卷积 操作; ◆o3、 o4: 3×3和5×5的扩张卷积 操作; ◆o5: 3×3的平均池化操作; ◆o6: 3×3的平均池化操作; ◆o7: 跳跃连接; ◆o8: 零操作; 定义 和ei, j:权 利 要 求 书 1/3 页 2 CN 115131727 A 2其中, 表示对om分配的softmax加权系数, ei, j表示对i→j连接边分配的softmax加权 系数; βi,j为i→j连接边分配的参数; 对中间结点与其所有前继节点之间的连接边赋予一个权重实现搜索, 此时, 中间结点 的计算公式为: 最优架构的搜索过程利用梯度下降的策略对α 和β 进行优化 来实现; 步骤1‑6: 下支路P2中B5输出的特征按纵向水平均匀分割为H块, 得到H个尺寸相同的部 件的细粒度特征块, 各细粒度特征块块分别经过不同的线性 嵌入层得到H个256 ‑dim的局部 特征, 这H个局部特征表示通过ID  Loss进行监督; 上支路P1中B4输出经过平均池化层得到 粗粒度特 征, 再经过线性嵌入层和全连接层进行处 理; 步骤2: 损失函数; 步骤2‑1: 粗粒度分支: 上分支P1的检索损失函数由两 部分组成, 用式(5)表示: 式中, 第一项为交叉熵损失, 第二项为三元组损失函数; M表示原样本的个数, 代表训练 数据的样本数量, gm表示第m张行人样本的分类特征g, C代表训练行人身份数, gm(c)表示特 征gm的第c个元素; fm、 分别为第m张行人图像的原样本, 与第m张原样本具有相同标 签的最难的正样本, 即特征之间的距离最远和与第m张原样本具有相同标签的最难的负样 本, 即特征之间的距离最近的25 6‑dim全局特 征; 步骤2‑2: 细粒度分支: 对于下分支P2, 输出被复制为两个部分, 除了保留一个更高分辨率的全局特征用于全 局损失度量外, 另一份将身体部件进行编码, 输出H个256 ‑dim的局部特征, 该局部特征又由 不同的线性变换层映射后得到H个C ‑dim分类特征向量p, 最终分别接入不同的分类器独立 地进行多个局部粒度特 征的学习; 对于每一 块身体部件, 其损失函数为: 式中, 表示第m张行人样本分割的第i块身体部件的分类特征p, C代表训练行人身份 数, 表示 的第c个元 素; 步骤2‑3: 设置全局粗粒度特 征结合局部细粒度特 征的多目标损失函数如下: Ltotal= λ1LP1+λ2LP2                           (7) 式中, λ1和 λ2为平衡上分支P1和下分支P2的参数, 其中损失函数Lp1和Lp2的具体形式分 别为:权 利 要 求 书 2/3 页 3 CN 115131727 A 3

.PDF文档 专利 一种基于残差单元结构搜索的行人重识别方法

文档预览
中文文档 17 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于残差单元结构搜索的行人重识别方法 第 1 页 专利 一种基于残差单元结构搜索的行人重识别方法 第 2 页 专利 一种基于残差单元结构搜索的行人重识别方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 06:58:04上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。