面向人流密集型公共场所的公卫消耗品使用量预测方法技术

技术编号：32832542 阅读：20 留言：0更新日期：2022-03-26 20:47

一种面向人流密集型公共场所的公卫消耗品使用量预测方法，通过将公共卫生场所的相关历史数据制成训练样本后，输入到采用Bagging策略的随机森林方法中，通过对多个基学习器进行组合并调整随机森林参数使准确率达标后，输出模型；再将实时采集到的人流量、环境监测数据输入到上述模型内以得到未来一段时间的公卫设施消耗品使用量预测值。本发明专利技术通过机器学习得到公卫设施消耗品使用量与人流量、环境因子多变量之间的非线性关系，实现对公卫设施消耗品使用量的预测。耗品使用量的预测。耗品使用量的预测。

全部详细技术资料下载

【技术实现步骤摘要】
面向人流密集型公共场所的公卫消耗品使用量预测方法

[0001]本专利技术涉及的是一种机器学习领域的技术，具体是一种基于随机森林的、面向人流密集型公共场所的公共卫生设施消耗品(如口罩、手消液)使用量预测方法。

技术介绍

[0002]在公共卫生问题比较突出时，人流密集型公共场所，包括：地铁、火车站、飞机场，常常会高密度地布设各类公共卫生设施，以便市民安全出行。这些公卫设施包括：口罩机、手消液机、急救包，均具有消耗品需要及时补充。随着设施点位的增加，公卫设施消耗品的运维工作变得繁杂且低效。部分消耗品的用量可以通过在现场传感器进行采集和远程传输，以便及时处理。但是，仍存在无法实时监测用量状态的公卫设施，而且对于未来一段时间内公共卫生设施消耗品使用量的预测当前还没有合适的方法，以致于运维人员不能前瞻性地备货和进行补给。
[0003]有关研究表明，病毒的传播与所处公共场所的环境因子、人流量因素存在强相关性，而人们对于公共卫生设施消耗品的使用频率及用量与病毒的传播强度也存在很大关联，因此本专利技术认为人流密集型公共场所的人流量、环境因子多变量与公卫消耗品使用量之间存在关联关系，且这种关联关系不是线性关系。

技术实现思路

[0004]本专利技术针对现有技术存在的上述不足，提出一种面向人流密集型公共场所的公卫消耗品使用量预测方法，采用随机森林模型，通过机器学习建立了上述关联关系的模型，用于对人流密集型公共场所的公卫消耗品使用量进行预测，通过机器学习得到公卫设施消耗品使用量与人流量、环境因子多变量之间的非线性关系...

【技术保护点】

【技术特征摘要】
1.一种面向人流密集型公共场所的公卫消耗品使用量预测方法，其特征在于，通过将公共卫生场所的相关历史数据制成训练样本后，输入到采用Bagging策略的随机森林方法中，通过对多个基学习器进行组合并调整随机森林参数使准确率达标后，输出模型；再将实时采集到的人流量、环境监测数据输入到上述模型内以得到未来一段时间的公卫设施消耗品使用量预测值；所述的人流量是指以单位时间经过目标场所的人员总量；所述的环境因子包括：二氧化碳浓度、PM10、PM2.5、风速、温度和湿度；所述的相关历史数据是指：目标场所内的过去一段时间的人流量、环境因子监测数据和公卫设施消耗品实际使用量数据，以小时为基准进行数据整理；所述的训练样本是指：是对相关历史数据处理后得到的数据集，具体包括：时序化处理、异常数据剔除处理、数据聚合处理、数据增广处理和标准化处理；所述的准确率是指：测试样本中的实际使用量和预测使用量之间的差距，用均方误差RMSE指标来评估。2.根据权利要求1所述的面向人流密集型公共场所的公卫消耗品使用量预测方法，其特征是，所述的实时采集是指：人流量按每小时为单位采集，环境类数据按60秒为单位采集，每小时计算一个算术平均值。3.根据权利要求1所述的面向人流密集型公共场所的公卫消耗品使用量预测方法，其特征是，所述的时序化处理是指：将数据按照时间顺序进行排列；所述的异常数据剔除处理是指：将无用的和存在缺失字段的数据删除，因为里面存在传感器采集损害或其他原因导致的数据异常，需要通过相应的规则将异常数据剔除；所述的数据聚合处理是指：将时序化的数据每隔一段时间进行聚合，聚合的方法包括：最大值聚合、最小值聚合、平均值聚合、方差聚合、峰度聚合与偏度聚合，这样做的原始是因为传感器采集的数据频率过大，包含很多无用信息，该方法能够最大程度保留数据原始的特征，并且让该方...

【专利技术属性】
技术研发人员：郑婕，吴刚，
申请(专利权)人：上海交通大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人