(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210577056.8
(22)申请日 2022.05.25
(71)申请人 天翼爱音乐文化科技有限公司
地址 510060 广东省广州市中山 二路18号
电信广场19 楼
(72)发明人 陆赞信
(74)专利代理 机构 广州嘉权专利商标事务所有
限公司 4 4205
专利代理师 陈嘉乐
(51)Int.Cl.
G06V 20/52(2022.01)
G06V 20/40(2022.01)
G06V 10/82(2022.01)
G06V 10/766(2022.01)
G06V 10/28(2022.01)G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
一种基于深度学习的人数预测方法、 装置、
设备及介质
(57)摘要
本发明公开了一种基于深度学习的人数预
测方法、 装置、 设备及存储介质, 本发明通过对训
练视频数据进行第一处理, 包括: 对训练视频数
据进行量化处理, 得到时间连续的若干个第一图
像,对第一图像进行预处理并对 预处理结果进行
背景化处理得到背景图像; 根据预处理结果和背
景图像的像素差确定第二图像, 将第二图像与第
一图像合并得到合并数据, 将合并数据输入至神
经网络模型进行训练得到预测模 型, 使得输入至
神经网络模型进行训练的合并数据是时间上连
续的图像, 利用空间和时间上的合成表示, 即使
出现某一阶段的跳帧也只会丢失其中的某个第
一图像, 降低跳帧对训练视频数据的连续性影
响, 使得人数预测结果更加准确, 本发明可广泛
应用于深度学习领域。
权利要求书2页 说明书9页 附图2页
CN 114882439 A
2022.08.09
CN 114882439 A
1.一种基于深度学习的人 数预测方法, 其特 征在于, 包括:
获取训练视频 数据;
对所述训练视频数据进行第一处理, 所述第一处理包括: 对所述训练视频数据进行量
化处理, 得到时间连续的若干个第一图像; 对所述第一图像进 行预处理, 并对预 处理结果进
行背景化处理, 得到背景图像; 根据所述预处理结果和所述背景图像的像素差确定第二图
像, 将所述第二图像与所述第一图像合并, 得到合并数据;
将所述合并数据输入至神经网络模型进行训练, 得到预测模型;
获取待检测视频数据, 对所述待检测视频数据进行第二处理, 并将第二处理结果输入
至所述预测模型, 得到人数预测结果; 所述第二处理为将所述待检测视频数据作为所述训
练视频数据进行的所述第一处 理。
2.根据权利要求1所述基于深度 学习的人数预测方法, 其特征在于: 所述对所述第 一图
像进行预处理, 包括:
对所述第一图像进行重采样处理至预设通道级别, 得到若干个不同量化级别的量化图
像。
3.根据权利要求1或2所述基于深度学习的人数预测方法, 其特征在于: 所述对预处理
结果进行背景化处 理, 得到背景图像, 包括:
根据预设采用速率以及预设数量, 通过循环图像缓冲器积累预处理结果, 得到采样图
像;
计算所述循环图像缓冲器中所述采样图像的每一像素的直方图; 所述直方图包括若干
个量化级别的元素, 每一所述元素表征一个量化级别出现在所述采样图像中的像素位置的
频率;
根据所述频率 最高的像素位置的像素值得到背景图像。
4.根据权利要求3所述基于深度学习的人 数预测方法, 其特 征在于: 所述方法还 包括:
获取新的第一图像以得到新的采样图像;
根据所述背景图像 计算新的直方图以得到新的元 素和新的频率;
当所述新的频率的最大值大于等于预设阈值, 根据新的所述频率最高的像素位置的像
素值得到背景图像对应的像素值更新背景图像。
5.根据权利要求1所述基于深度 学习的人数预测方法, 其特征在于: 所述根据 所述预处
理结果和所述背景图像的像素差确定第二图像, 包括:
计算所述预处 理结果与所述背景图像的每一像素的像素差的绝对值;
通过灰度转换函数计算所述绝对值的转换值, 当所述转换值大于等于二进制化阈值,
将预设图像中对应的像素置1, 否则置 0, 得到第二图像。
6.根据权利要求1所述基于深度 学习的人数预测方法, 其特征在于: 所述预测模型包括
卷积层、 递归层以及线性输出层; 所述将所述合并数据输入至神经网络模型进 行训练, 得到
预测模型, 包括:
生成所述第二图像的人 数标注, 根据人 数标注以及合并数据得到训练集;
将所述训练集输入所述卷积层进行 卷积处理, 得到若干特 征图;
将所述特征图输入至所述递归层进行递归处理; 所述递归层包括若干个依序连接的
LSTM层;权 利 要 求 书 1/2 页
2
CN 114882439 A
2将递归处理结果输入至所述线性输出层, 得到预测人数, 根据所述预测人数以及所述
人数标注修改神经网络模型的网络参数, 得到预测模型。
7.根据权利要求1所述基于深度学习的人 数预测方法, 其特 征在于: 所述方法还 包括:
获取历史数据; 所述历史数据包括时间、 日期、 天气、 事 件以及人 数预测结果;
将所述历史数据输入至LSTM模型进行训练, 得到LSTM网络模型;
将待处理数据输入至LSTM网络模型, 得到人流预测结果。
8.一种基于深度学习的人 数预测装置, 其特 征在于, 包括:
获取模块, 用于获取训练视频 数据;
处理模块, 用于对所述训练视频数据进行第一处理, 所述第 一处理包括: 对所述训练视
频数据进 行量化处理, 得到时间连续的若干个第一图像; 对所述第一图像进行预 处理, 并对
预处理结果进行背景化处理, 得到背景图像; 根据所述预处理结果和所述背景图像的像素
差确定第二图像, 将所述第二图像与所述第一图像合并, 得到合并数据;
训练模块, 用于将所述 合并数据输入至神经网络模型进行训练, 得到预测模型;
输出模块, 用于获取待检测视频数据, 对所述待检测视频数据进行第 二处理, 并将第二
处理结果输入至所述预测模型, 得到人数预测结果; 所述第二处理为将所述待检测视频数
据作为所述训练视频 数据进行的所述第一处 理。
9.一种电子设备, 其特征在于, 所述电子设备包括处理器和存储器, 所述存储器中存储
有至少一条指 令、 至少一段程序、 代码集 或指令集, 所述至少一条指 令、 所述至少一段程序、
所述代码集或指令集由所述处 理器加载并执 行以实现如权利要求1 ‑7中任一项所述方法。
10.一种计算机可读存储介质, 其特征在于, 所述存储介质中存储有至少一条指令、 至
少一段程序、 代码集或指令集, 所述至少一条指令、 所述至少一段程序、 所述代码集或指令
集由处理器加载并执 行以实现如权利要求1 ‑7中任一项所述方法。权 利 要 求 书 2/2 页
3
CN 114882439 A
3
专利 一种基于深度学习的人数预测方法、装置、设备及介质
文档预览
中文文档
14 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 06:58:08上传分享