一种基于人口迁徙大数据的流行病感染人数估算方法技术

技术编号:24097772 阅读:31 留言:0更新日期:2020-05-09 11:16
本发明专利技术提供一种基于人口迁徙大数据的流行病感染人数估算方法,包括:获取各疫区市迁出至各目标市的人口数量、各疫区市的感染比例,以及各目标市的常住人口、各目标区/县的常住人口、主要道路长度、铁路长度和住宅小区点数量;以各疫区市的感染比例作为加权系数,对人口数量进行加权求和计算,得到第一加权人口数量;根据所述第一加权人口数量,得到第二加权人口数量;将第二加权人口数量、各目标区/县的常住人口、主要道路长度、铁路长度和住宅小区点数量输入至已训练的流行病感染人数估算模型,获得各目标区/县的流行病感染人数。相对于现有技术,本发明专利技术从多维角度对区/县尺度的流行病感染人数进行估算,为区/县疫情防控提供技术支撑。

A method to estimate the number of people infected by epidemic diseases based on population migration big data

【技术实现步骤摘要】
一种基于人口迁徙大数据的流行病感染人数估算方法
本专利技术涉及数据分析领域,特别是涉及一种基于人口迁徙大数据的流行病感染人数估算方法。
技术介绍
目前,新型冠状病毒感染肺炎(CoronaVirusDisease2019,COVID-19)对群众生产生活、社会公共卫生安全造成严重的影响,并且,COVID-19疫区的人群迁出数量相对较大,会对输入地区造成较大的流行风险。在这种情况下,亟需对输入省份内各区/县的COVID-19感染人数进行快速预估,以实现对不同区/县的防控等级进行科学预划分,为后续的差异化防控管理提供支撑。目前主要通过流行病传播模型SIR,进行城市尺度的COVID-19感染人群估算,模型需要参数比较多,而且很多参数较难准确获取,导致无法实现在区/县尺度的COVID-19感染人群的估算。
技术实现思路
为克服相关技术中存在的问题,本专利技术实施例提供了一种基于人口迁徙大数据的流行病感染人数估算方法、装置及设备。根据本专利技术实施例的第一方面,提供了一种基于人口迁徙大数据的流行病感染人数估算方法,包括如下步骤:获取第一疫情期间内从各疫区市i分别迁出至目标省内各目标市j的人口数量、所述第一疫情期间内所述各疫区市i的感染比例,以及所述各目标市j的常住人口、所述各目标市j内各目标区/县k的常住人口、所述各目标区/县k的主要道路长度roadsk、铁路长度railsk和住宅小区点数量livingsk;以所述各疫区市i的感染比例作为加权系数,对所述各疫区市i分别迁出至所述各目标市j的人口数量进行加权求和计算,得到所有疫区市i迁出至每个所述各目标市j的第一加权人口数量;根据所述第一加权人口数量以及所述各目标区/县k的常住人口占所述各目标市j的常住人口的比例,得到所述所有疫区市i迁出至每个所述各目标区/县k的第二加权人口数量;将所述第二加权人口数量以及所述各目标区/县k的常住人口、主要道路长度roadsk、铁路长度railsk和住宅小区点数量livingsk输入至已训练的流行病感染人数估算模型,获得所述第一疫情期间内所述各目标区/县k的流行病感染人数。可选的,基于百度迁徙大数据,获取第一疫情期间内所述各疫区市i每天的迁徙规模指数indexi,t以及所述各疫区市i每天的迁出目的地占比;基于所述各疫区市i对应的统计年鉴,获取所述各疫区市i的常住人口;根据所述各疫区市i每天的迁徙规模指数indexi,t和所述各疫区市i的常住人口,得到所述各疫区市i每天的迁出人口数量;根据所述各疫区市i每天的迁出人口数量和所述各疫区市i每天的迁出目的地占比,得到所述第一疫情期间内从所述各疫区市i分别迁出至所述目标市j的人口数量。可选的,获取百度迁徙大数据的统一资源定位符,根据所述统一资源定位符,爬取所述第一疫情期间内所述各疫区市i每天的迁徙规模指数indexi,t以及所述各疫区市i每天的迁出目的地占比。可选的,获取所述第一疫情期间内所述各疫区市i的初始感染比例,其中,所述各疫区市i的初始感染比例为所述各疫区市i的确诊病例数量与该疫区市i的常住人口之间的比值;对所述各疫区市i的初始感染比例进行归一化处理,得到所述第一疫情期间内所述各疫区市i的感染比例。可选的,基于OSM公开地图,获取所述目标省内道路图层属性字段为预设道路图层属性字段的第一主要道路图层,并提取所述目标省内铁路图层属性字段为预设铁路图层属性自段的第一铁路图层;根据所述各目标区/县k的行政区划分图,分别裁剪所述第一主要道路图层和第一铁路图层,得到所述各目标区/县k对应的第二主要道路图层和第二铁路图层;根据所述第二主要道路图层和所述第二铁路图层,得到所述各目标区/县k的主要道路长度roadsk和铁路长度railsk。可选的,获取第二疫情期间内所述各目标区/县k的确诊病例数、所述第二疫情期间内所述所有疫区市i迁出至每个所述各目标区/县k的第二加权人口数量以及所述各目标区/县k的所述常住人口、所述主要道路长度roadsk、所述铁路长度railsk和所述住宅小区点数量livingsk;基于XGBoost算法,以所述第二疫情期间内所述各目标区/县k的确诊病例数为因变量,以所述第二疫情期间内所述所有疫区市i迁出至每个所述各目标区/县k的第二加权人口数量以及所述各目标区/县k的所述常住人口、所述主要道路长度roadsk、所述铁路长度railsk和所述住宅小区点数量livingsk为自变量,训练得到所述流行病感染人数估算模型。根据本专利技术实施例的第二方面,提供一种基于人口迁徙大数据的流行病感染人数估算装置,包括:第一采集单元,用于获取第一疫情期间内从各疫区市i分别迁出至目标省内各目标市j的人口数量、所述第一疫情期间内所述各疫区市i的感染比例,以及所述各目标市j的常住人口、所述各目标市j内各目标区/县k的常住人口、所述各目标区/县k的主要道路长度roadsk、铁路长度railsk和住宅小区点数量livingsk;第一处理单元,用于以所述各疫区市i的感染比例作为加权系数,对所述各疫区市i分别迁出至所述各目标市j的人口数量进行加权求和计算,得到所有疫区市i迁出至每个所述各目标市j的第一加权人口数量;第二处理单元,用于根据所述第一加权人口数量以及所述各目标区/县k的常住人口占所述各目标市j的常住人口的比例,得到所述所有疫区市i迁出至每个所述各目标区/县k的第二加权人口数量;估算单元,用于将所述第二加权人口数量以及所述各目标区/县k的常住人口、主要道路长度roadsk、铁路长度railsk和住宅小区点数量livingsk输入至已训练的流行病感染人数估算模型,获得所述第一疫情期间内所述各目标区/县k的流行病感染人数。根据本专利技术实施例的第三方面,提供一种基于人口迁徙大数据的流行病感染人数估算设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如上述第一方面所述的基于人口迁徙大数据的流行病感染人数估算方法的步骤。根据本专利技术实施例的第四方面,提供一种计算机可读存储介质,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述第一方面所述的基于人口迁徙大数据的流行病感染人数估算方法的步骤。相对于现有技术,本申请实施例综合考虑了各疫区市的感染比例对迁出人口流行性的影响,根据该感染比例对各疫区市的迁出人口数量进行加权处理,得到从所有疫区市迁出至各目标市的第一加权人口数量,进而再根据各目标区/县在目标市内的人口占比,得到从所有疫区市迁出至各目标区/县的第二加权人口数量;之后,再将各目标区/县的第二加权人口数量、常住人口、主要道路长度、铁路长度和住宅小区点数量共同输入至已训练的流行病感染人数估算模型,快速估算出目标省内各区/县的流行病感染人数。本申请实施例通过从迁出人口的数量、迁出人口流行性、交通建设程度、人口密集程度等多维角度对本文档来自技高网...

【技术保护点】
1.一种基于人口迁徙大数据的流行病感染人数估算方法,其特征在于,包括步骤:/n获取第一疫情期间内从各疫区市i分别迁出至目标省内各目标市j的人口数量

【技术特征摘要】
1.一种基于人口迁徙大数据的流行病感染人数估算方法,其特征在于,包括步骤:
获取第一疫情期间内从各疫区市i分别迁出至目标省内各目标市j的人口数量、所述第一疫情期间内所述各疫区市i的感染比例,以及所述各目标市j的常住人口、所述各目标市j内各目标区/县k的常住人口、所述各目标区/县k的主要道路长度roadsk、铁路长度railsk和住宅小区点数量livingsk;
以所述各疫区市i的感染比例作为加权系数,对所述各疫区市i分别迁出至所述各目标市j的人口数量进行加权求和计算,得到所有疫区市i迁出至每个所述各目标市j的第一加权人口数量;
根据所述第一加权人口数量以及所述各目标区/县k的常住人口占所述各目标市j的常住人口的比例,得到所述所有疫区市i迁出至每个所述各目标区/县k的第二加权人口数量;
将所述第二加权人口数量以及所述各目标区/县k的常住人口、主要道路长度roadsk、铁路长度railsk和住宅小区点数量livingsk输入至已训练的流行病感染人数估算模型,获得所述第一疫情期间内所述各目标区/县k的流行病感染人数。


2.根据权利要求1所述的基于人口迁徙大数据的流行病感染人数估算方法,其特征在于,所述获取第一疫情期间内从各疫区市i分别迁出至目标省内各目标市j的人口数量,包括步骤:
基于百度迁徙大数据,获取第一疫情期间内所述各疫区市i每天的迁徙规模指数indexi,t以及所述各疫区市i每天的迁出目的地占比;
基于所述各疫区市i对应的统计年鉴,获取所述各疫区市i的常住人口;
根据所述各疫区市i每天的迁徙规模指数indexi,t和所述各疫区市i的常住人口,得到所述各疫区市i每天的迁出人口数量;
根据所述各疫区市i每天的迁出人口数量和所述各疫区市i每天的迁出目的地占比,得到所述第一疫情期间内从所述各疫区市i分别迁出至所述目标市j的人口数量。


3.根据权利要求2所述的基于人口迁徙大数据的流行病感染人数估算方法,其特征在于,所述基于百度迁徙大数据,获取第一疫情期间内所述各疫区市i每天的迁徙规模指数indexi,t以及所述各疫区市i每天的迁出目的地占比,包括步骤:
获取百度迁徙大数据的统一资源定位符,根据所述统一资源定位符,爬取所述第一疫情期间内所述各疫区市i每天的迁徙规模指数indexi,t以及所述各疫区市i每天的迁出目的地占比。


4.根据权利要求1至3任意一项所述的基于人口迁徙大数据的流行病感染人数估算方法,其特征在于,所述获取所述第一疫情期间内所述各疫区市i的感染比例,包括步骤:
获取所述第一疫情期间内所述各疫区市i的初始感染比例,其中,所述各疫区市i的初始感染比例为所述各疫区市i的确诊病例数量与该疫区市i的常住人口之间的比值;
对所述各疫区市i的初始感染比例进行归一化处理,得到所述第一疫情期间内所述各疫区市i的感染比例。


5.根据权利要求1至3任意一项所述的基于人口迁徙大数据的流行病感染人数估算方法,其特征在于,所述获取所述各目标区/县k的主要道路长度roadsk和铁路长度railsk,包括步骤:
基于OSM公开地图,获取所述目标省内道路图层属性字段为预设道路图层属性字段的第一主要道路图层,并提取所述目标省内铁路图层属性字段为预设铁路图层属性自段的第一铁路图层;
根据所述各目标区/县k的行政区划分图,分别裁剪所述第一主要道路图层和第一铁路图层,得到所述各目标区/县k对应的第二主要道路图层和第二铁路图层;
根据所述第二主要道路图层和所述第二铁路图层,...

【专利技术属性】
技术研发人员:许剑辉邓应彬黄吴蒙陈裕婵杨骥张虹鸥李勇
申请(专利权)人:广州地理研究所南方海洋科学与工程广东省实验室广州
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1