【技术实现步骤摘要】
一种基于大数据的传染病预测方法及系统
[0001]本专利技术涉及传染病预测
,更具体地说,它涉及一种基于大数据的传染病预测方法及系统。
技术介绍
[0002]传染病尤其是新冠疫情的传播迅速,社会危害性大,因此需要对传染病开发一种预测方法及系统,从而方便政府部门确定公共卫生突发事件、指导传染病的预防、监控和救治。
[0003]目前,市场上的传染病预测方法及系统只仅能预测某个地区的整体得病率,并没有具体到个人的得病率预测,更没有可供政府监控整体得病率与个人针对自己查询得病率的双功能系统平台,不利于个人对于传染病的及时预防,进而降低了政府管控疾病的实际效果。
技术实现思路
[0004]针对现有技术存在的不足,本专利技术的目的在于提供一种基于大数据的传染病预测方法及系统。
[0005]为实现上述目的,本专利技术提供了如下技术方案:一种基于大数据的传染病预测方法,所述一种基于大数据的传染病预测方法包括如下步骤:S1:全部人员身份信息获取,获取某地区人员的身份信息以及每天的行程信息至第一数据库;S2:发病人员信息获取,获取某地区每天的发病人数,获取发病人员及其家人的身份信息,获取发病人员近三天的行程信息,并将以上信息上传至第二数据库;S3:人员与发病人员相关性判断,调取第一数据库以及第二数据库的信息对用户与发病人员的相关性进行判断,判断用户是否为发病人员,若判断结果为是,则将用户标记为病者,若判断结果为否,则判断用户是否为发病人员的家人,若判断结果为是,则将用户标记为密接者,若判断结果为否, ...
【技术保护点】
【技术特征摘要】
1.一种基于大数据的传染病预测方法,其特征在于,所述一种基于大数据的传染病预测方法包括如下步骤:S1:全部人员身份信息获取,获取某地区人员的身份信息以及每天的行程信息至第一数据库;S2:发病人员信息获取,获取某地区每天的发病人数,获取发病人员及其家人的身份信息,获取发病人员近三天的行程信息,并将以上信息上传至第二数据库;S3:人员与发病人员相关性判断,调取第一数据库以及第二数据库的信息对用户与发病人员的相关性进行判断,判断用户是否为发病人员,若判断结果为是,则将用户标记为病者,若判断结果为否,则判断用户是否为发病人员的家人,若判断结果为是,则将用户标记为密接者,若判断结果为否,则继续判断用户的三天内行程信息是否与发病人员的行程重合,若判断结果为是,则将用户标记为次密接者,若判断结果为否,则继续判断用户是否与标记为密接者的行程重合,若判断结果为是,则将用户标记为一般密接者,若判断结果为否,则将用户标记为非密接者,密接者、次密接者、一般密接者以及非密接者均可叠加标记;S4:历史病患信息存档,从第二数据库调取该地区两个月前的发病人员及其密接者、次密接者和一般密接者的身份信息,按不同发病人员分类构建多个集合,并以与发病人员相关的密接者、次密接者和一般密接者作为各自集合的元素,并上传至第三数据库;S5:历史接触者患病概率计算,从第三数据库中获取各个集合中密接者、次密接者和一般密接者的人数以及分别以标记为节点的半个月之内的发病人数,从而计算得到每组密接者、次密接者和一般密接者的得病率,最后计算密接者、次密接者和一般密接者得病率的平均值,并作为后续预测个人得病率的一项数据组;S6:建立负二项分布模型,从第一数据库该地区的总人数,从第二数据库获取以当天为节点往后一年内该地区每天的发病人员数,以r为每天的发病人数,k为每天的未发病人数,p表示每天有r人得病的概率,(1—p)则表示每天有r人未得病的概率,将以上数据代入公式:F(k;r,p)=Ck+r
‑
1 r
‑1·
p
r
·
(1—p)
k
,从而建立负二项分布模型,通过负二项分布模型获得该地区发病人数的概率趋势;S7:个人患病概率预测:建立线性回归模型;Yk=β0+β1X1+β2X2+
……
+β
k
X
k
,将S5中计算得到的历史密接者平均发病概率或次密接者平均发病概率或一般密接者平均发病概率与S6中该地区预测的得病率作为X1,X2
……
Xk的自变量带入Yk=β0+β1X1+β2X2+
……
+β
k
X
k
,从而得到用户分别标记为密接者或次密接者或一般密接者或叠加标记或非密接者时的患病概率;S8:多个地区发病率预测,按照S1至S7步骤预测多个地区的发病概率趋势以及每个地区个人的患病概率。2.根据权利要求1所述的一种...
【专利技术属性】
技术研发人员:闫艳,夏存兴,
申请(专利权)人:南京汉卫公共卫生研究院有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。