国家标准网
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210330918.7 (22)申请日 2022.03.30 (71)申请人 国家电网有限公司大 数据中心 地址 100031 北京市西城区宣武门内大街8 号 (72)发明人 陈振宇 王路涛 李博 陈思宇 边靖宸 武丽莎 杨畅 (74)专利代理 机构 北京安博达知识产权代理有 限公司 1 1271 专利代理师 徐国文 (51)Int.Cl. G06V 10/762(2022.01) G06V 10/774(2022.01) G06V 10/74(2022.01) G06V 10/82(2022.01)G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种基于深度学习的影像相似度数据清洗 方法及系统 (57)摘要 本发明提供了一种基于深度学习的影像相 似度数据清洗方法及系统, 包括: 获取影像数据, 并对所述影像数据进行处理得到成对的影像数 据; 将所述成对的影像数据输入到预先训练好的 融合网络模 型中, 得到所述 成对的影像数据的相 似性度量值; 由所述成对的影像数据的相似性度 量值对所述影像数据进行聚类完成数据清洗; 其 中, 所述预先训练好的融合网络模 型是基于成对 的影像数据结合包含损失项和正则化项的学习 目标函数对双支卷积神经网络进行训练得到的。 本发明采用了融合网络结合损失函数的方法, 解 决了人力标注成本高, 效率低下, 容易产生重复 操作的问题, 实现了对相同场景下的类似部件进 行聚类, 提高了效率和准确率。 权利要求书2页 说明书8页 附图6页 CN 114863153 A 2022.08.05 CN 114863153 A 1.一种基于深度学习的影 像相似度数据清洗方法, 其特 征在于, 包括: 获取影像数据, 并对所述影 像数据进行处 理得到成对的影 像数据; 将所述成对的影像数据输入到预先训练好的融合网络模型中, 得到所述成对的影像数 据的相似性度量 值; 由所述成对的影 像数据的相似性度量 值对所述影 像数据进行聚类完成数据清洗; 其中, 所述预先训练好的融合网络模型是基于成对的影像数据 结合包含损失项和正则 化项的学习目标函数对双支卷积神经网络进行训练得到的。 2.如权利要求1所述的方法, 其特 征在于, 所述融合网络模型的训练包括: 获取影像数据; 对所述影 像数据进行处 理, 得到成对的影 像数据; 并对所述成对的影像数据按照相似度的大小划分正样本和负样本, 并分别对正样本和 负样本设置相似度量 值; 将所述正样本和所述负样本分别作为双支卷积神经网络的输入, 将所述正样本和所述 负样本对应的相似度量值分别作为双支卷积神经网络的输出, 以损失项和正则化项作为学 习目标函数, 对所述双支卷积神经网络的进行训练, 得到训练好的融合网络模型。 3.如权利要求1所述的方法, 其特征在于, 所述将所述成对的影像数据输入到预先训练 好的融合网络模型中, 得到所述成对的影 像数据的相似性度量 值包括: 将所述成对的影 像数据通过双支卷积神经网络从原 始空间映射到低维度目标空间; 基于所述低维度目标空间中的成对的影像数据结合所述学习目标函数得到所述成对 的影像数据的相似性度量 值。 4.如权利要求1所述的方法, 其特征在于, 所述由所述成对的影像数据的相似性度量值 对所述影 像数据进行聚类完成数据清洗包括: 若所述相似性度量值达到预先设定的值则对成对的影像数据进行聚类, 完成清洗, 否 则去除影 像数据。 5.如权利要求3所述的方法, 其特 征在于, 所述学习目标函数按下式计算: 式中, w为神经网络的权 重; 为第i个训练影 像的输出神经 元; yi为相应的标签。 6.一种基于深度学习的影 像相似度数据清洗系统, 其特 征在于, 包括: 获取模块, 用于获取影 像数据, 并对所述影 像数据进行处 理得到成对的影 像数据; 输入模块, 用于将所述成对的影像数据输入到预先训练好的融合网络模型中, 得到所 述成对的影 像数据的相似性度量 值; 聚类模块, 由所述成对的影像数据的相似性度量值对所述影像数据进行聚类完成数据 清洗; 其中, 所述预先训练好的融合网络模型是基于成对的影像数据 结合包含损失项和正则 化项的学习目标函数对双支卷积神经网络进行训练得到的。 7.如权利要求6所述的系统, 其特 征在于, 所述融合网络模型的训练包括: 获取影像数据;权 利 要 求 书 1/2 页 2 CN 114863153 A 2对所述影 像数据进行处 理, 得到成对的影 像数据; 并对所述成对的影像数据按照相似度的大小划分正样本和负样本, 并分别对正样本和 负样本设置相似度量 值; 将所述正样本和所述负样本分别作为双支卷积神经网络的输入, 将所述正样本和所述 负样本对应的相似度量值分别作为双支卷积神经网络的输出, 以损失项和正则化项作为学 习目标函数, 对所述双支卷积神经网络的进行训练, 得到训练好的融合网络模型。 8.如权利要求6所述的系统, 其特 征在于, 所述输入 模块具体用于: 将所述成对的影 像数据通过双支卷积神经网络从原 始空间映射到低维度目标空间; 基于所述低维度目标空间中的成对的影像数据结合所述学习目标函数得到所述成对 的影像数据的相似性度量 值。 9.如权利要求8所述的系统, 其特 征在于, 所述学习目标函数按下式计算: 式中, w为神经网络的权 重; 为第i个训练影 像的输出神经 元; yi为相应的标签。权 利 要 求 书 2/2 页 3 CN 114863153 A 3
专利 一种基于深度学习的影像相似度数据清洗方法及系统
文档预览
中文文档
17 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 14:32:18
上传分享
举报
下载
原文档
(847.3 KB)
分享
友情链接
GB-T 29344-2023 灵芝孢子粉采收及加工技术规范.pdf
GB-T 1236-2017 工业通风机 用标准化风道性能试验.pdf
DB51-T 3050-2023 四川省行政执法案件编号规则 四川省.pdf
GB-T 51314-2018 数据中心基础设施运行维护标准.pdf
YD-T 3838-2021 通信制造业绿色工厂评价细则.pdf
T-LPCX 01—2020 黎平香茶.pdf
杭州市公共数据授权运营实施方案2.21.pdf
数据安全框架202308.pptx
TTAF 180.4—2023 小程序个人信息保护规范 第4部分:全生命周期.pdf
GB-T 42668-2023 钐铁氮粘结永磁粉.pdf
GB-T 30596-2014 温拌沥青混凝土.pdf
DB11-T 2046.2-2022 智慧停车系统技术要求 第2部分:停车场(库)外场设备 北京市.pdf
GB-T 10357.7-2013 家具力学性能试验 第7部分:桌类稳定性.pdf
T-CEC 5069—2022 飞轮储能电站设计规范.pdf
GB-T 33174-2016 资产管理 管理体系 GB-T 33173 应用指南.pdf
GB-T 16903.2-2023 标志用图形符号表示规则 第2部分:公共信息图形符号的通用符号要素.pdf
T-CAS 600—2022 经营者公平竞争合规管理体系建设.pdf
GB-T 22186-2016 信息安全技术 具有中央处理器的IC卡芯片安全技术要求.pdf
奇安信 自动化渗透测试系统-主打PPT.pptx
GB-T 33092-2016 皮带运输机清扫器聚氨酯刮刀.pdf
1
/
3
17
评价文档
赞助2.5元 点击下载(847.3 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。