一种基于大数据的传染病预测方法及系统技术方案

技术编号:35315504 阅读:17 留言:0更新日期:2022-10-22 13:07
本发明专利技术公开了一种基于大数据的传染病预测方法及系统,涉及传染病预测技术领域,其技术方案要点是结构包括第一信息模块、第二信息模块、第三信息模块、判断模块、数据分析模块、地区发病率预测模块、个人得病率预测模块、用户端和监测端,效果是本发明专利技术通过获取各个地区的总人员信息并记录各个地区每天的患病人员信息,再通过建立负二项分布模型,从而得到各个地区发病人数的概率趋势,便于政府监控并预测各个地区的发病率,提高政府对于疾病的预防措施;通过构建线性回归模型,从而得到用户分别标记为密接者或次密接者或一般密接者或叠加标记或非密接者时的患病概率,便于用户查询自身的得病率,从而根据预测的得病率及时预防或入院检查。或入院检查。或入院检查。

【技术实现步骤摘要】
一种基于大数据的传染病预测方法及系统


[0001]本专利技术涉及传染病预测
,更具体地说,它涉及一种基于大数据的传染病预测方法及系统。

技术介绍

[0002]传染病尤其是新冠疫情的传播迅速,社会危害性大,因此需要对传染病开发一种预测方法及系统,从而方便政府部门确定公共卫生突发事件、指导传染病的预防、监控和救治。
[0003]目前,市场上的传染病预测方法及系统只仅能预测某个地区的整体得病率,并没有具体到个人的得病率预测,更没有可供政府监控整体得病率与个人针对自己查询得病率的双功能系统平台,不利于个人对于传染病的及时预防,进而降低了政府管控疾病的实际效果。

技术实现思路

[0004]针对现有技术存在的不足,本专利技术的目的在于提供一种基于大数据的传染病预测方法及系统。
[0005]为实现上述目的,本专利技术提供了如下技术方案:一种基于大数据的传染病预测方法,所述一种基于大数据的传染病预测方法包括如下步骤:S1:全部人员身份信息获取,获取某地区人员的身份信息以及每天的行程信息至第一数据库;S2:发病人员信息获取,获取某地区每天的发病人数,获取发病人员及其家人的身份信息,获取发病人员近三天的行程信息,并将以上信息上传至第二数据库;S3:人员与发病人员相关性判断,调取第一数据库以及第二数据库的信息对用户与发病人员的相关性进行判断,判断用户是否为发病人员,若判断结果为是,则将用户标记为病者,若判断结果为否,则判断用户是否为发病人员的家人,若判断结果为是,则将用户标记为密接者,若判断结果为否,则继续判断用户的三天内行程信息是否与发病人员的行程重合,若判断结果为是,则将用户标记为次密接者,若判断结果为否,则继续判断用户是否与标记为密接者的行程重合,若判断结果为是,则将用户标记为一般密接者,若判断结果为否,则将用户标记为非密接者,密接者、次密接者、一般密接者以及非密接者均可叠加标记;S4:历史病患信息存档,从第二数据库调取该地区两个月前的发病人员及其密接者、次密接者和一般密接者的身份信息,按不同发病人员分类构建多个集合,并以与发病人员相关的密接者、次密接者和一般密接者作为各自集合的元素,并上传至第三数据库;S5:历史接触者患病概率计算,从第三数据库中获取各个集合中密接者、次密接者和一般密接者的人数以及分别以标记为节点的半个月之内的发病人数,从而计算得到每组密接者、次密接者和一般密接者的得病率,最后计算密接者、次密接者和一般密接者得病率
的平均值,并作为后续预测个人得病率的一项数据组;S6:建立负二项分布模型,从第一数据库该地区的总人数,从第二数据库获取以当天为节点往后一年内该地区每天的发病人员数,以r为每天的发病人数,k为每天的未发病人数,p表示每天有r人得病的概率,(1—p)则表示每天有r人未得病的概率,将以上数据代入公式:F(k;r,p)=Ck+r

1 r
‑1·
p
r
·
(1—p)
k
,从而建立负二项分布模型,通过负二项分布模型获得该地区发病人数的概率趋势;S7:个人患病概率预测:建立线性回归模型;Yk=β0+β1X1+β2X2+
……

k
X
k
,将S5中计算得到的历史密接者平均发病概率或次密接者平均发病概率或一般密接者平均发病概率与S6中该地区预测的得病率作为X1,X2
……
Xk的自变量带入Yk=β0+β1X1+β2X2+
……

k
X
k
,从而得到用户分别标记为密接者或次密接者或一般密接者或叠加标记或非密接者时的患病概率;S8:多个地区发病率预测,按照S1至S7步骤预测多个地区的发病概率趋势以及每个地区个人的患病概率。
[0006]优选地,所述S2中发病人员获取方式为以下两种:一、获取各地医院就诊病人信息,二、患者自己上传患病证明信息。
[0007]优选地,所述S3中病者的标记持续至病情痊愈,密接者以及次密接者的标记持续时间为30天,一般密接者的标记持续15天。
[0008]优选地,所述S4中的第三数据库中建立树状结构存储空间,将多个得病者以及与其相关联的密接者、次密接者和一般密接者的身份信息按树状结构进行分类存储。
[0009]优选地,所述S7中叠加标记的人员得病率的计算方法为:将叠加标记中所包含的所有标记的历史发病率以及该地区预测的发病率分别作为X1,X2
……
Xk带入Yk=β0+β1X1+β2X2+
……

k
X
k
,计算得到叠加标记人员的得病率,标记为非接触者的得病率计算方法为:将该地区预测的发病率作为自变量带入Yk=β0+β1X1+β2X2+
……

k
X
k
公式中,从而计算得病率。
[0010]一种基于大数据的传染病预测系统,所述系统包括:第一信息模块:该模块用于获取并存储某地区人员的身份信息以及每天的行程信息;第二信息模块:该模块用于获取并存储某地区每天的发病人数、发病人员及其家人的身份信息以及发病人员近三天的行程信息;判断模块:该模块用于判断并标记用户与发病人员的相关性;第三信息模块:该模块用于调取第二信息模块中两个月前的发病人员及其密接者、次密接者和一般密接者的身份信息,并按不同发病人员分类构建多个集合,以与发病人员相关的密接者、次密接者和一般密接者作为各自集合的元素并存储;数据分析模块:该模块用于分别计算密接者、次密接者和一般密接者的历史患病概率;地区发病率预测模块:该模块用于建立负二项分布模型,并通过负二项分布模型获得该地区发病人数的概率趋势;个人得病率预测模块:该模块用于建立线性回归模型,并以历史密接者平均发病概率或次密接者平均发病概率或一般密接者平均发病概率与该地区预测的得病率为自变量,预测个人得病率;
用户端:用于为系统用户提供查询个人发病概率的模块;监测端:用于政府监测并预测各地区的发病率。
[0011]优选地,所述第一信息模块包括第一数据库,所述第二信息模块包括第二数据库,第三信息模块包括第三数据库。
[0012]优选地,所述基于大数据的传染病预测系统包含多个服务器,所述第一信息模块、第二信息模块、判断模块、第三信息模块、数据分析模块、地区发病率预测模块、为服务器的硬件模块。
[0013]与现有技术相比,本专利技术具备以下有益效果:本专利技术通过获取各个地区的总人员信息并记录各个地区每天的患病人员信息,再通过建立负二项分布模型,从而得到各个地区发病人数的概率趋势,便于政府监控并预测各个地区的发病率,提高政府对于疾病的预防措施;通过判断用户与发病人员的相关性,从而将用户标记为密接者、次密接者、一般密接者和非密接者,通过计算密接者、次密接者和一般密接者的平均历史发病率,配合由负二项分布模型预测的发病率,构建线性回归模型,从而得到用户分别标记为密接者或次密接者或一般密接者或叠加标记或非密接者时的患本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于大数据的传染病预测方法,其特征在于,所述一种基于大数据的传染病预测方法包括如下步骤:S1:全部人员身份信息获取,获取某地区人员的身份信息以及每天的行程信息至第一数据库;S2:发病人员信息获取,获取某地区每天的发病人数,获取发病人员及其家人的身份信息,获取发病人员近三天的行程信息,并将以上信息上传至第二数据库;S3:人员与发病人员相关性判断,调取第一数据库以及第二数据库的信息对用户与发病人员的相关性进行判断,判断用户是否为发病人员,若判断结果为是,则将用户标记为病者,若判断结果为否,则判断用户是否为发病人员的家人,若判断结果为是,则将用户标记为密接者,若判断结果为否,则继续判断用户的三天内行程信息是否与发病人员的行程重合,若判断结果为是,则将用户标记为次密接者,若判断结果为否,则继续判断用户是否与标记为密接者的行程重合,若判断结果为是,则将用户标记为一般密接者,若判断结果为否,则将用户标记为非密接者,密接者、次密接者、一般密接者以及非密接者均可叠加标记;S4:历史病患信息存档,从第二数据库调取该地区两个月前的发病人员及其密接者、次密接者和一般密接者的身份信息,按不同发病人员分类构建多个集合,并以与发病人员相关的密接者、次密接者和一般密接者作为各自集合的元素,并上传至第三数据库;S5:历史接触者患病概率计算,从第三数据库中获取各个集合中密接者、次密接者和一般密接者的人数以及分别以标记为节点的半个月之内的发病人数,从而计算得到每组密接者、次密接者和一般密接者的得病率,最后计算密接者、次密接者和一般密接者得病率的平均值,并作为后续预测个人得病率的一项数据组;S6:建立负二项分布模型,从第一数据库该地区的总人数,从第二数据库获取以当天为节点往后一年内该地区每天的发病人员数,以r为每天的发病人数,k为每天的未发病人数,p表示每天有r人得病的概率,(1—p)则表示每天有r人未得病的概率,将以上数据代入公式:F(k;r,p)=Ck+r

1 r
‑1·
p
r
·
(1—p)
k
,从而建立负二项分布模型,通过负二项分布模型获得该地区发病人数的概率趋势;S7:个人患病概率预测:建立线性回归模型;Yk=β0+β1X1+β2X2+
……

k
X
k
,将S5中计算得到的历史密接者平均发病概率或次密接者平均发病概率或一般密接者平均发病概率与S6中该地区预测的得病率作为X1,X2
……
Xk的自变量带入Yk=β0+β1X1+β2X2+
……

k
X
k
,从而得到用户分别标记为密接者或次密接者或一般密接者或叠加标记或非密接者时的患病概率;S8:多个地区发病率预测,按照S1至S7步骤预测多个地区的发病概率趋势以及每个地区个人的患病概率。2.根据权利要求1所述的一种...

【专利技术属性】
技术研发人员:闫艳夏存兴
申请(专利权)人:南京汉卫公共卫生研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1