国家标准网
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210565509.5 (22)申请日 2022.05.23 (71)申请人 广州大学 地址 510006 广东省广州市大 学城外环西 路230号 (72)发明人 蔡长青 贾羽彤 甘淞宇 彭俊源 汤铭柯 (74)专利代理 机构 广州高炬知识产权代理有限 公司 44376 专利代理师 孙明科 (51)Int.Cl. G06T 7/246(2017.01) G06T 7/277(2017.01) G06T 7/66(2017.01) G06V 10/25(2022.01)G06V 10/26(2022.01) G06V 10/764(2022.01) G06V 10/774(2022.01) G06V 10/82(2022.01) G06V 20/40(2022.01) G06V 20/52(2022.01) G06V 40/10(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06Q 50/08(2012.01) (54)发明名称 一种基于视觉的场外施工深度学习实例分 割跟踪方法 (57)摘要 本发明公开了一种基于视觉的场外施工深 度学习实例分割跟踪方法, 其包括以下步骤: 步 骤S1: 实例分割: 实例分割模块从输入视频中检 测工作者, 得到工作者的包围盒和分割掩码; 步 骤S2: 实例关联: 实例关联模块在所述输入视频 的每两个连续帧上构造一个工作实例关联矩阵; 步骤S3: 实例指派: 实例指派模块利用匈牙利算 法在实例指派中产生跟踪结果。 本发 明用于追踪 建筑工地上非现场施工工作者的身体轮廓, 将实 例分割引入到场外施工工作者跟踪中, 使工地管 理具有更强的追踪性, 从而提升非现场施工工作 者的视觉检测效率和现场安全。 权利要求书2页 说明书4页 附图2页 CN 114897937 A 2022.08.12 CN 114897937 A 1.一种基于视觉的场外施工深度学习实例分割跟踪方法, 其特征在于, 其将实例分割 引入到场外施工工作者跟踪中, 使工地管理具有更强的追踪性, 从而提升非现场施工工作 者的视觉检测效率和现场安全, 包括以下步骤: 步骤S1: 实例分割: 实例分割模块从输入视频中检测工作者, 得到工作者的包围盒和分 割掩码; 步骤S2: 实例关联: 实例关联模块在所述输入视频的每两个连续帧上构造一个工作实 例关联矩阵; 步骤S3: 实例指派: 实例指派模块利用匈 牙利算法在实例指派中产生跟踪结果。 2.根据权利要求1所述的基于视觉的场外施工深度学习实例分割跟踪方法, 其特征在 于, 在所述步骤S1实例分割模块中, 使用基于深度学习的掩码R ‑CNN算法遮蔽R ‑CNN; 所述掩 码R‑CNN方法包括 三个模块: 特 征提取器模块、 区域建议网络模块和扩展分类 器网络模块。 3.根据权利要求2所述的基于视觉的场外施工深度学习实例分割跟踪方法, 其特征在 于, 所述掩码R ‑CNN深度学习 算法, 通过使用掩码来描述工作者的身体部位, 获得相比目标 检测分割方法更精确的掩 模来描述被遮挡的工作者。 4.根据权利要求2或3所述的基于视觉的场外施工深度学习实例分割跟踪方法, 其特征 在于, 所述掩码R ‑CNN深度学习算法的具体步骤如下: 由ResNet101神经网络对输入图像进行处理, 提取特征提取模块中的特征映射; 利用 RPN模块对N ×N空间窗口的特征映射进行滑动; 在这个模块中, 为每个滑动窗口初始 化12个 锚定框作为兴趣区域, 这些锚定框由三个长宽比和四个比例比定义; 每个感兴趣区域由三 层卷积网络处理, 两层全连通盒分类和盒回归处理RPN模块根据它们成为对象的可能性产 生300个ROIs。 5.根据权利要求2或3所述的基于视觉的场外施工深度学习实例分割跟踪方法, 其特征 在于, 所述掩码R ‑CNN深度学习算法, 采用感兴趣 区域对齐技术, 从每个感兴趣区域的特征 图中提取固定形状特征; 在ECLS模块中, 这些固定形状特征分别由三个神经网络进行盒分 类、 盒回归和掩模回归处理; 其中, 盒分类网络产生属于任意预定义类的每个投资回报率的 置信度; 回归网络预测每个对 象的像素坐标, 掩模回归网络预测每个对 象在像素级别的分 割掩模。 6.根据权利要求1所述的基于视觉的场外施工深度学习实例分割跟踪方法, 其特征在 于, 所述步骤S2实例关联模块采用基于掩 模的方法来优化工作者跟踪的关联步骤。 7.根据权利要求6所述的基于视觉的场外施工深度学习实例分割跟踪方法, 其特征在 于, 所述步骤中S2实例关联模块中, 卡尔曼滤波预测和模糊推理结合得到一种新的实例关 联方法。 8.根据权利要求6所述的基于视觉的场外施工深度学习实例分割跟踪方法, 其特征在 于, 所述的步骤S2实例关联模块, 是以所述步骤S1实例分割模块生成的工作者的包围盒和 掩码作为输入, 将每两帧连续的工作者分割 结果关联起来, 并为实例分配模块生成一个关 联矩阵。 9.根据权利要求6所述的基于视觉的场外施工深度学习实例分割跟踪方法, 其特征在 于, 在所述步骤S2实例关联模块中, 输入图像时, 一旦一个新的工作者实例在一个帧被分 割, 卡尔曼滤波跟踪器将 被初始化来跟踪这个实例, 通过使用这个工作者的边框信息, 其中权 利 要 求 书 1/2 页 2 CN 114897937 A 2一个唯一的ID号被分配给Tracklet; 卡尔曼滤波使用了一系列随时间变化的观测数据, 并 产生下一时间步长的估计; 每 个物体的状态模拟如下: STATE=[Cx, Cy, u, v] 其中Cx和Cy分别表示物体包围盒中心点的水平和垂直坐标; u和v表示物体在水平和垂 直坐标上的速度; 卡尔曼 滤波被用来跟踪工件实例的中心点, 而不是用来跟踪包围盒。 10.根据权利要求5所述的基于视觉的场外施工深度学习实例分割跟踪方法, 其特征在 于, 所述步骤S2关联模块的具体步骤如下: 卡尔曼滤波利用前一帧的包围盒信息, 预测工作者在当前帧的中心点位置; 将运动向 量计算为同一工作实例在当前帧和前一帧之间的中心点运动; 通过将检测到的遮罩与运动 矢量相加, 得到当前帧上 的跟踪遮罩; 将当前帧上 的关联矩阵计算为当前帧上跟踪掩模和 分段掩模的掩模交叉过并。权 利 要 求 书 2/2 页 3 CN 114897937 A 3
专利 一种基于视觉的场外施工深度学习实例分割跟踪方法
文档预览
中文文档
9 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 06:58:28
上传分享
举报
下载
原文档
(648.1 KB)
分享
友情链接
GB-T 28827.8-2022 信息技术服务 运行维护 第8部分:医院信息系统管理要求.pdf
GB-T 17639-2023 土工合成材料 长丝纺粘针刺非织造土工布.pdf
T-ZKJXX 00032—2023 长波接收机技术要求及测试方法.pdf
GB-T 22576.4-2021 医学实验室 质量和能力的要求 第4部分:临床化学检验领域的要求.pdf
江苏省公共数据管理办法.pdf
GB-T 714-2015 桥梁用结构钢.pdf
GB-T 42449-2023 系统与软件工程 功能规模测量 IFPUG方法.pdf
中国大模型发展研究报告(2024)(1).pdf
DB5301-T 100-2023 改性磷石膏综合利用 矿山生态修复 跟踪评估规范 昆明市.pdf
GB-T 21052-2007 信息安全技术 信息系统物理安全技术要求.pdf
证券公司网络和信息安全三年提升计划(2023-2025).pdf
GB-T 34680.2-2021 智慧城市评价模型及基础评价指标体系 第2部分:信息基础设施.pdf
T-ZJSXX 01—2022 浙江省学生精神 心理 障碍休学-复学标准和办理程序.pdf
DB63-T 2070-2022 自然保护区数据库建设和更新技术规范 青海省.pdf
GB-T 15843.4-2024 信息技术 安全技术 实体鉴别 第4部分:采用密码校验函数的机制.pdf
民航 MH-T 0046-2014 民航重要信息系统灾难备份与恢复实施规范.pdf
商用密码应用安全性评估“十问十答”.pdf
SN-T 1732.23-2019 烟花爆竹用烟火药剂中铅、铬、镉、汞和砷含量的测定 电感耦合等离子体发射光谱法.pdf
DB32-T 3605-2019 餐饮业安全厨房通用规范 江苏省.pdf
SY-T 7644-2021 盐穴型储气库井筒及盐穴密封性检测技术规范.pdf
1
/
3
9
评价文档
赞助2.5元 点击下载(648.1 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。