(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210584461.2
(22)申请日 2022.05.26
(71)申请人 东南大学成贤学院
地址 210088 江苏省南京市江北新区东大
路6号
(72)发明人 郁佳佳 李玄锋
(74)专利代理 机构 南京瑞弘专利商标事务所
(普通合伙) 32249
专利代理师 张宁馨
(51)Int.Cl.
G06V 20/40(2022.01)
G06V 20/52(2022.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
G06V 10/82(2022.01)
(54)发明名称
一种基于改进YOLOv5s网络的防鸟撞事故目
标检测方法
(57)摘要
本发明公开了一种基于改进YOLOv5s网络的
防鸟撞事故目标检测方法, 首先引入通道注意力
机制SE模块, 并选择SE后置的YOLOv5s_SEA嵌入
方式作为改进Backbone方案, 然后在H ead中引入
混合域注意力机制CBA M模块, 并选用先通过通道
域再通过空间域的YOL Ov5s_CBAMA方案作为改进
方案; 接着在Head的输出端加入解耦头, 改进后
使用IOU损失函数训练reg分支, BCE损失函数训
练cls分支; 同时在Head的输出端引入趋势感知
损失TAL和趋势因子wi, 根据每个物体的移动趋
势生成自适应权重, 解决预测框的漂移问题; 本
发明提供的防鸟撞事故目标检测方法可以有效
提升小目标的检测精度, 并降低延 迟带来的检测
效果不够实时的问题, 提升了网络对目标物体的
检测效率, 从而改善 了漏检的问题。
权利要求书2页 说明书11页 附图5页
CN 115063714 A
2022.09.16
CN 115063714 A
1.一种基于改进YOLOv5s网络的防鸟撞事故目标检测方法, 其特征在于, 包括以下步
骤:
步骤S1、 对红外监控视频进行python切 片处理, 然后进行数据清洗, 并对不同类型的图
片进行label Img标注; 选取YOLOv5s网络结构进行初始模型训练;
步骤S2、 将通道注意力机制SE模块分别引入YOLOv5s网络中Backbone、 Neck和He ad三大
模块特征融合区域; 选用SE后置的YOLOv5s_SEA嵌入方式作为改进Backbo ne方案;
步骤S3、 在Head中引入混合域注意力机制CBAM模块, 并选用先通过通道域再通过空间
域的YOLOv5s_CBAMA方案作为改进方案;
步骤S4、 在Head的输出端加入解耦头, 改进后使用IOU损失函数训练reg分支, BCE损失
函数训练cls 分支;
步骤S5、 在Head的输出端引入趋势感知损失TAL和趋势因子wi, 根据每个物体的移动趋
势生成自适应权 重, 解决预测框的漂移问题;
步骤S6、 将YOLOv5s训练权重best.pt文件部署在Jet son Nano上, 并对实际的飞机场应
用场景进行识别与检测, 以及测试使用嵌入式设备Jetson Nano的运行效果, 使 该系统可以
在其他场合使用。
2.根据权利 要求1所述的一种基于改进YOLOv5s网络的防鸟撞事故目标检测方法, 其特
征在于, 所述 步骤S2中进入SE模块具体操作步骤 包括:
步骤S2.1、 普通卷积 操作:
Uc=Ftr(Xi)
其中, Ftr表示为Transformati on各个网络模型原有的卷积 操作;
步骤S2.2、 在各个通道上的空间维度上进行Squeeze压缩过程; 采用全局平均池化, 将
信息压缩到相应的通道中, 从而扩展全局的感受野, 得到1个统计量, 此时1个统计量表 示一
个通道, 最终将维度H ×W×C的特征图压成一个1 ×1×C的向量, 变换公式如下 所示:
其中, Fsq表示为Squeeze压缩; H表示为Height; W表示为Width; Xi表示为输入; XC表示为
输出;
步骤S2.3、 将得到的特征信息经过两个全连接层, 通过w来生成相对应的通道权重, 进
行Excitation激活过程, 通过δ激活函数Relu, 然后经过σ 激活函数sigmoid, 最终得到权重
值, 变换公式如下 所示:
S=Fex(z, W)=σ(g(z, W) )=σ(W2δ(W1z))
其中, Fex表示为激活过程;
步骤S2.4、 利用上一步得到的权重值, 进行Scale标准化步骤; 将得到的权重采用乘法
加权的方式分配到每个通道中, 完成在通道维度上的重标定, 得到新的特征图; 变换公式如
下
其中, Fscale表示为Scale标准化。权 利 要 求 书 1/2 页
2
CN 115063714 A
23.根据权利 要求2所述的一种基于改进YOLOv5s网络的防鸟撞事故目标检测方法, 其特
征在于, 所述步骤S3中CBAM模块包括通道注意力和空间注意力两个子模块, 通过通道注意
力模块, 将输入网络的特征图分别从宽高进行全局 最大池化过程和全局平均池化过程, 然
后再通过两层神经网络, 最后进行sigmo id激活, 得到通道 注意力特 征Mc; 具体如下:
其中, AvgPool表示为全局平均池化; MaxPool表示为全局最大池化; σ 表示为sigmoid激
活函数; M0为RC/r×C; r为降维因子且r=16; M1为RC×C/r; Mc表示通道注意力特 征;
将输出Mc作为空间注意力模块的输入, 进行池化操作, 然后通过一个7 ×7卷积过程, 最
后通过sigmo id激活函数生成空间注意力特 征, 即Ms, 具体表示如下:
其中, f7×7表示为7×7卷积; Mc表示空间注意力特 征。
4.根据权利 要求3所述的一种基于改进YOLOv5s网络的防鸟撞事故目标检测方法, 其特
征在于, 所述 步骤S5中引入趋势感知损失TAL和趋势因子wi的具体方法如下:
步骤S5.1、 将YOLOv5s网络作为Baseline, 构造成一个三元组的GT框进行训练, 即使用
上一帧Ft‑1、 当前帧Ft和下一帧Gt+1, 即(Ft‑1,Ft,Gt+1); 取两个相邻的帧(Ft‑1, Ft)作为输入训
练模型, 预测下一帧的GT框; 由Ft帧的真实GT框监督Gt+1的GT框, 基于输入和监督的三元组,
将训练数据集重建为
的形式;
步骤S5.2、 通过计算两帧GT之间的IoU矩阵, 对帧的维度求最大值, 得到两帧之间检测
对象的匹配IoU; 匹配的IoU值大小与物体移动速度成反比; 当有新对象出现在帧中时, 没有
与之匹配的框, 此时设置阈值 τ, 具体 计算公式如下 所示:
其中, maxj表示为Ft中方框间 的最大操作 值t, v表示为新对象的恒定权重; wi通过调节τ
和v两个参数, 缓解了时延问题。权 利 要 求 书 2/2 页
3
CN 115063714 A
3
专利 一种基于改进YOLOv5s网络的防鸟撞事故目标检测方法
文档预览
中文文档
19 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 06:57:47上传分享