(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210290158.1
(22)申请日 2022.03.23
(71)申请人 上海东普信息科技有限公司
地址 201700 上海市青浦区外 青松公路
5045号508室U区4 4号
(72)发明人 徐梦佳 李斯 杨周龙
(74)专利代理 机构 北京市京大律师事务所
11321
专利代理师 胡安
(51)Int.Cl.
G06V 20/52(2022.01)
G06V 10/774(2022.01)
G06V 10/764(2022.01)
G06V 10/82(2022.01)
G06N 3/04(2006.01)G06N 3/08(2006.01)
G06K 9/62(2022.01)
G06Q 10/08(2012.01)
(54)发明名称
图像识别方法、 装置、 设备及存 储介质
(57)摘要
本发明涉及图像识别领域, 公开了一种图像
识别方法、 装置、 设备及存储介质, 用于提高识别
效率。 图像识别方法包括: 获取待识别图片, 待识
别图片中包括有多个目标对象, 目标对象为监控
影像中码放的货物; 调用训练好的识别模型对待
识别图片进行识别, 得到目标识别结果, 目标识
别结果用于指示货物码放的规范情况; 当目标识
别结果为货物码放不规范时, 生成警示信息并将
警示信息发送至管理终端; 当目标识别结果为货
物码放规范时, 生成码放规范信息并将码放规范
信息发送至管理终端; 当目标识别结果为其他情
况时, 将待识别图片中的多个目标对象进行标
记, 生成提醒信息并将提醒信息发送至管理终
端, 其他情况表示目标识别结果需要进行二次判
定。
权利要求书2页 说明书11页 附图4页
CN 114724076 A
2022.07.08
CN 114724076 A
1.一种图像识别方法, 其特 征在于, 所述图像识别方法包括:
获取待识别图片, 所述待识别图片中包括有多个目标对象, 所述目标对象为监控影像
中码放的货物;
调用训练好的识别模型对所述待识别图片进行识别, 得到目标识别结果, 所述目标识
别结果用于指示货物码放的规范情况;
当所述目标识别结果为货物码放不规范时, 生成警示信 息并将所述警示信 息发送至管
理终端;
当所述目标识别结果为货物码放规范时, 生成码放规范信 息并将所述码放规范信 息发
送至管理终端;
当所述目标识别结果为其他情况时, 将所述待识别图片中的多个目标对象进行标记,
生成提醒信息并将所述提醒信息发送至管理终端, 所述其他情况表示所述目标识别结果需
要进行二次判定 。
2.根据权利要求1所述的图像识别方法, 其特征在于, 所述调用训练好的识别模型对所
述待识别图片进行识别, 得到目标识别结果, 所述 目标识别结果用于指示货物码放的规范
情况, 包括:
通过所述训练好的识别模型中的密集卷积网络对所述待识别图片进行特征提取, 得到
目标特征图, 所述训练好的识别模型包括密集卷积网络、 注意力网络和激活函数;
通过所述注意力网络对所述目标 特征图进行加权计算, 得到目标 特征向量列表;
调用所述激活函数对所述目标 特征向量列表进行分类 计算, 得到目标分类值;
根据所述目标分类值确定目标识别结果。
3.根据权利要求2所述的图像识别方法, 其特征在于, 所述通过所述训练好的识别模型
中的密集卷积网络对所述待识别图片进行特征提取, 得到目标特征图, 所述训练好的识别
模型包括密集卷积网络、 注意力网络和激活函数, 包括:
通过所述密集卷积网络的第 一密集块对所述待识别图片进行初步特征提取, 得到初步
特征图, 所述第一密集 块包括批量归一 化层、 修正线性单 元层和卷积层;
将所述初步特征图输入第一过渡块进行下采样, 得到经过下采样的特征图, 所述第一
过渡块包括池化层;
将所述经过下采样的特征图再输入所述密集卷积网络中剩余的密集块和剩余的过渡
块, 其中, 所述剩余的密集块之 间通过所述剩余的过渡块连接, 重复执行特征提取和下采样
操作, 最终生成目标 特征图。
4.根据权利要求2所述的图像识别方法, 其特征在于, 所述通过所述注意力网络对所述
目标特征图进行加权计算, 得到目标 特征向量列表, 包括:
根据所述目标 特征图进行点积运 算得到注意力得分;
将所述注意力得分进行归一 化计算, 得到 权重系数表;
根据所述权 重系数表对所述目标 特征图进行加权求和, 得到目标 特征向量列表。
5.根据权利要求1所述的图像识别方法, 其特征在于, 在所述获取待识别图片之前, 还
包括:
以预设时长为单位获取至少一个监控影像, 所述至少一个监控影像在时间维度 上不产
生重叠;权 利 要 求 书 1/2 页
2
CN 114724076 A
2按照预设规则对所述至少一个监控影像进行筛选, 得到目标视频帧, 并将所述目标视
频帧确定为待识别图片。
6.根据权利要求1 ‑5中任一项所述的图像识别方法, 其特征在于, 在所述调用训练好的
识别模型对所述待识别图片进行识别, 得到目标识别结果之前, 还 包括:
获取监控影像, 对所述监控影像进行筛选, 得到多个样本图片, 所述样本图片为所述监
控影像的视频帧;
将所述多个样本 图片进行分类, 得到三个图片集和三个类别标签, 所述三个图片集包
括码货规范 的图片集、 码货不规范 的图片集和 其他图片集, 所述三个类别标签与所述三个
图片集一一对应;
搭建初始 识别模型, 所述初始 识别模型包括密集卷积网络、 注意力网络和激活函数;
根据所述三个图片集和所述三个类别标签对所述初始识别模型进行训练, 得到训练好
的识别模型。
7.根据权利要求6所述的图像识别方法, 其特征在于, 所述根据 所述三个图片集和所述
三个类别标签对所述初始 识别模型进行训练, 得到训练好的识别模型, 包括:
设置训练代数和批尺寸, 所述训练代数为初始识别模型的训练次数, 所述批尺寸为每
次训练时输入的样本图片数量;
将所述训练代数、 所述批尺寸、 所述三个图片集和所述三个类别标签作为所述初始识
别模型训练的入参, 对所述初始 识别模型进行训练, 得到训练好的识别模型。
8.一种图像识别装置, 其特 征在于, 所述图像识别装置包括:
获取模块, 用于获取待识别图片, 所述待识别图片中包括有多个目标对象, 所述目标对
象为监控影像中码放的货物;
识别模块, 用于调用训练好的识别模型对所述待识别图片进行识别, 得到目标识别结
果, 所述目标识别结果用于指示货物码放的规范情况;
第一生成模块, 用于当所述目标识别结果为货物码放不规范时, 生成警示信息并将所
述警示信息发送至管理终端;
第二生成模块, 用于当所述目标识别结果为货物码放规范时, 生成码放规范信息并将
所述码放 规范信息发送至管理终端;
第三生成模块, 用于当所述目标识别结果为其他情况时, 将所述待识别图片中的多个
目标对象进行标记, 生成提醒信息并将所述提醒信息发送至管理终端, 所述其他情况表示
所述目标识别结果需要 进行二次判定 。
9.一种图像识别设备, 其特征在于, 所述图像识别设备包括: 存储器和至少一个处理
器, 所述存 储器中存 储有指令;
所述至少一个处理器调用所述存储器中的所述指令, 以使得所述图像识别设备执行如
权利要求1 ‑7中任意一项所述的图像识别方法。
10.一种计算机可读存储介质, 所述计算机可读存储介质上存储有指令, 其特征在于,
所述指令被处 理器执行时实现如权利要求1 ‑7中任一项所述图像识别方法。权 利 要 求 书 2/2 页
3
CN 114724076 A
3
专利 图像识别方法、装置、设备及存储介质
文档预览
中文文档
18 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 12:05:26上传分享