专利 一种基于深度学习的人数预测方法、装置、设备及介质

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210577056.8 (22)申请日 2022.05.25 (71)申请人天翼爱音乐文化科技有限公司地址 510060 广东省广州市中山二路18号电信广场19 楼 (72)发明人陆赞信　 (74)专利代理机构广州嘉权专利商标事务所有限公司 4 4205 专利代理师陈嘉乐 (51)Int.Cl. G06V 20/52(2022.01) G06V 20/40(2022.01) G06V 10/82(2022.01) G06V 10/766(2022.01) G06V 10/28(2022.01)G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称一种基于深度学习的人数预测方法、装置、设备及介质 (57)摘要本发明公开了一种基于深度学习的人数预测方法、装置、设备及存储介质，本发明通过对训练视频数据进行第一处理，包括：对训练视频数据进行量化处理，得到时间连续的若干个第一图像,对第一图像进行预处理并对预处理结果进行背景化处理得到背景图像；根据预处理结果和背景图像的像素差确定第二图像，将第二图像与第一图像合并得到合并数据，将合并数据输入至神经网络模型进行训练得到预测模型，使得输入至神经网络模型进行训练的合并数据是时间上连续的图像，利用空间和时间上的合成表示，即使出现某一阶段的跳帧也只会丢失其中的某个第一图像，降低跳帧对训练视频数据的连续性影响，使得人数预测结果更加准确，本发明可广泛应用于深度学习领域。权利要求书2页说明书9页附图2页 CN 114882439 A 2022.08.09 CN 114882439 A 1.一种基于深度学习的人数预测方法，其特征在于，包括：获取训练视频数据；对所述训练视频数据进行第一处理，所述第一处理包括：对所述训练视频数据进行量化处理，得到时间连续的若干个第一图像；对所述第一图像进行预处理，并对预处理结果进行背景化处理，得到背景图像；根据所述预处理结果和所述背景图像的像素差确定第二图像，将所述第二图像与所述第一图像合并，得到合并数据；将所述合并数据输入至神经网络模型进行训练，得到预测模型；获取待检测视频数据，对所述待检测视频数据进行第二处理，并将第二处理结果输入至所述预测模型，得到人数预测结果；所述第二处理为将所述待检测视频数据作为所述训练视频数据进行的所述第一处理。 2.根据权利要求1所述基于深度学习的人数预测方法，其特征在于：所述对所述第一图像进行预处理，包括：对所述第一图像进行重采样处理至预设通道级别，得到若干个不同量化级别的量化图像。 3.根据权利要求1或2所述基于深度学习的人数预测方法，其特征在于：所述对预处理结果进行背景化处理，得到背景图像，包括：根据预设采用速率以及预设数量，通过循环图像缓冲器积累预处理结果，得到采样图像；计算所述循环图像缓冲器中所述采样图像的每一像素的直方图；所述直方图包括若干个量化级别的元素，每一所述元素表征一个量化级别出现在所述采样图像中的像素位置的频率；根据所述频率最高的像素位置的像素值得到背景图像。 4.根据权利要求3所述基于深度学习的人数预测方法，其特征在于：所述方法还包括：获取新的第一图像以得到新的采样图像；根据所述背景图像计算新的直方图以得到新的元素和新的频率；当所述新的频率的最大值大于等于预设阈值，根据新的所述频率最高的像素位置的像素值得到背景图像对应的像素值更新背景图像。 5.根据权利要求1所述基于深度学习的人数预测方法，其特征在于：所述根据所述预处理结果和所述背景图像的像素差确定第二图像，包括：计算所述预处理结果与所述背景图像的每一像素的像素差的绝对值；通过灰度转换函数计算所述绝对值的转换值，当所述转换值大于等于二进制化阈值，将预设图像中对应的像素置1，否则置 0，得到第二图像。 6.根据权利要求1所述基于深度学习的人数预测方法，其特征在于：所述预测模型包括卷积层、递归层以及线性输出层；所述将所述合并数据输入至神经网络模型进行训练，得到预测模型，包括：生成所述第二图像的人数标注，根据人数标注以及合并数据得到训练集；将所述训练集输入所述卷积层进行卷积处理，得到若干特征图；将所述特征图输入至所述递归层进行递归处理；所述递归层包括若干个依序连接的 LSTM层；权　利　要　求　书 1/2 页 2 CN 114882439 A 2将递归处理结果输入至所述线性输出层，得到预测人数，根据所述预测人数以及所述人数标注修改神经网络模型的网络参数，得到预测模型。 7.根据权利要求1所述基于深度学习的人数预测方法，其特征在于：所述方法还包括：获取历史数据；所述历史数据包括时间、日期、天气、事件以及人数预测结果；将所述历史数据输入至LSTM模型进行训练，得到LSTM网络模型；将待处理数据输入至LSTM网络模型，得到人流预测结果。 8.一种基于深度学习的人数预测装置，其特征在于，包括：获取模块，用于获取训练视频数据；处理模块，用于对所述训练视频数据进行第一处理，所述第一处理包括：对所述训练视频数据进行量化处理，得到时间连续的若干个第一图像；对所述第一图像进行预处理，并对预处理结果进行背景化处理，得到背景图像；根据所述预处理结果和所述背景图像的像素差确定第二图像，将所述第二图像与所述第一图像合并，得到合并数据；训练模块，用于将所述合并数据输入至神经网络模型进行训练，得到预测模型；输出模块，用于获取待检测视频数据，对所述待检测视频数据进行第二处理，并将第二处理结果输入至所述预测模型，得到人数预测结果；所述第二处理为将所述待检测视频数据作为所述训练视频数据进行的所述第一处理。 9.一种电子设备，其特征在于，所述电子设备包括处理器和存储器，所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如权利要求1 ‑7中任一项所述方法。 10.一种计算机可读存储介质，其特征在于，所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如权利要求1 ‑7中任一项所述方法。权　利　要　求　书 2/2 页 3 CN 114882439 A 3

专利 一种基于深度学习的人数预测方法、装置、设备及介质

专利一种基于深度学习的人数预测方法、装置、设备及介质