基于手机数据的呼吸道传染病密切接触者识别方法技术

技术编号:25274197 阅读:18 留言:0更新日期:2020-08-14 23:06
本发明专利技术公开了一种基于手机数据的呼吸道传染病密切接触者识别方法,包括以下步骤:根据手机信令数据和手机历史话单数据提取移动轨迹和通话关系;分析时空共现关系,判断潜在密切接触者;提取潜在密切接触者与确诊病例用户之间的时空共现及通话网络特征;构建模型及优化;将时空共现和通话网络特征输入到模型中,判断密切接触者和接触类型并输出。本发明专利技术解决了传统流行病学调查方法耗时耗力、信息获取不完整的问题;避免了调查人员被感染的风险;识别结果更加快速、准确、全面;还可以输出密切接触类别及风险等级,有助于对其采取不同的防控措施;模型具有较高的灵活性,可以随着数据样本的积累不断进行训练学习,从而提高识别精度。

【技术实现步骤摘要】
基于手机数据的呼吸道传染病密切接触者识别方法
本专利技术涉及一种呼吸道传染病密切接触者识别方法,尤其涉及一种基于手机数据的呼吸道传染病密切接触者识别方法,属于信息技术服务领域。
技术介绍
流行病的爆发会给人类健康、社会经济等带来重大影响。而对于常见的呼吸道传染病来说,如何快速、准确、全面地识别出已确诊病例的密切接触者,对其进行必要的隔离和筛查,对于阻断病毒传播、控制疫情发展等具有重要意义。目前对于密切接触者的识别主要采用流行病学调查的方式,需要调查人员近距离接触病例,询问其近期的活动轨迹以及密切接触人员。这种方式耗时耗力,还存在调查人员被感染的风险。同时,病例有时会对自己的活动轨迹及接触人员有所保留,或者出现回忆偏倚、错乱、不完整等情况。例如,病例通常只能回忆起近期与自己有过接触的熟人,而对于有过接触但是不认识的人(如售货员、同乘人员等),则无法确定。手机作为现代人随身携带的通信设备,其完整的记录了用户的历史位置信息及社交信息,这为确诊病例的密切接触者识别提供了新的手段。但是,目前相关研究还较为薄弱。有研究提出可以由用户使用微信小程序或APP记录自己的GPS活动轨迹,然后通过与病患活动轨迹进行时空邻近性对比来评估其感染风险,但是这种方法一方面需要用户自行采集GPS轨迹数据,时效性差且缺少历史轨迹信息;另一方面由于只考虑时空邻近关系,很容易将时空邻近但是未发生密切接触的人群判断为密切接触者。
技术实现思路
为了解决上述技术所存在的不足之处,本专利技术提供了一种基于手机数据的呼吸道传染病密切接触者识别方法。为了解决以上技术问题,本专利技术采用的技术方案是:一种基于手机数据的呼吸道传染病密切接触者识别方法,包括以下步骤:步骤Ⅰ、根据呼吸道传染病的确诊病例用户及非确诊病例用户的手机信令数据和手机历史话单数据,提取移动轨迹和通话关系;步骤Ⅱ、根据移动轨迹分析非确诊病例用户与确诊病例用户之间的时空共现关系,判断潜在密切接触者;根据通话关系构建包括通话频次参数和通话时长参数的通话网络;步骤Ⅲ、结合呼吸道传染病传染机制,提取潜在密切接触者与确诊病例用户之间的时空共现特征及通话网络特征;步骤Ⅳ、利用已有的密切接触者数据,提取其与对应确诊病例用户之间的时空共现特征及通话网络特征,然后输入到机器学习模型,进行模型的训练及优化;步骤Ⅴ、将潜在密切接触者与确诊病例用户之间的时空共现特征和通话网络特征输入到步骤Ⅳ训练好的机器学习模型中,判断密切接触者和接触类型,并输出相应风险等级。进一步地,步骤Ⅰ中,对于呼吸道传染病的确诊病例用户来说,首先确定其传染期,然后获取其在传染期内的移动轨迹;对于非确诊病例用户来说,获取其自疾病爆发以来的移动轨迹;对于潜伏期内就具有传染性的疾病来说,以发病时间减去最大潜伏期起,至确诊时间止,期间为传染期;对于潜伏期内不具有传染性的疾病来说,以发病时间起,至确诊时间止,期间为传染期。进一步地,应用移动轨迹序列来表示移动轨迹以便于后续计算;将手机信令数据根据时间进行排序形成移动轨迹序列,移动轨迹序列如公式①所示:Tramove={(x1,y1,t1),(x2,y2,t2),…,(xi,yi,ti)},公式①其中,xi和yi表示该用户在ti时刻的位置坐标。进一步地,步骤Ⅲ中时空共现特征包括:共现强度相关特征、共现位置相关特征以及共现时间相关特征;通话网络特征包括:通话强度相关特征、通话时间相关特征以及通话网络相关特征。进一步地,共现强度相关特征包括共现点个数、共现总时长、出行共现时长以及停留共现时长;共现位置相关特征包括共现点周围人口密度、共现点周围环境因素以及共现点疫情风险指数;共现时间相关特征包括工作时段共现时长、夜间共现时长、工作日共现时长以及非工作日共现时长;通话强度相关特征包括通话次数、通话总时长以及平均通话时长;通话时间相关特征包括工作时段通话时长、夜间通话时长、工作日通话时长以及非工作日通话时长;通话网络相关特征包括与共现确诊病例之间的网络最短路径。进一步地,步骤Ⅳ中机器学习模型为随机森林模型或神经网络模型。本专利技术具有的有益效果为:(1)基于低成本但是信息全的手机大数据进行呼吸道传染病密切接触者的识别,解决了传统流行病学调查方法耗时耗力、信息获取不完整的问题;(2)利用手机大数据还原确诊病例历史出行轨迹及活动场所,避免了流行病学调查人员与病例的近距离接触,可以降低调查人员被感染的风险;(3)在时空共现分析的基础上,结合呼吸道传染病传染机制,提取潜在密切接触者与病例间的时空共现特征和通话网络特征,然后采用多特征融合的机器学习模型对其做进一步的判别,因此识别结果更加准确;(4)在判断是否密切接触的同时,还可以输出密切接触类别及风险等级,有助于对其采取不同的防控措施;(5)模型具有较高的灵活性,可以随着数据样本的积累不断进行训练学习、参数调优,从而不断提高识别精度。附图说明图1为本专利技术的总体流程示意图。图2为时空共现分析示意图。图3为通话网络构建示意图。图4为密切接触判别具体流程示意图。具体实施方式下面结合附图和具体实施方式对本专利技术作进一步详细的说明。如图1所示的一种基于手机数据的呼吸道传染病密切接触者识别方法,包括以下步骤:步骤Ⅰ:用户移动轨迹及通话关系提取:该步骤的目的是为了基于手机大数据(信令数据+话单数据),提取手机用户移动轨迹及用户间通话关系。对于呼吸道传染病确诊病例用户来说,首先确定其可能具有传染性的时间段,即传染期。根据流行病传染机制,有些疾病在潜伏期内就具有传染性,而有些疾病在病例发病之后才具有传染性。因此,对于潜伏期内就具有传染性的疾病来说,以发病时间减去最大潜伏期起,至确诊时间止,期间为传染期:传染期=(发病时间-最大潜伏期,确诊时间)对于潜伏期内不具有传染性的疾病来说,以发病时间起,至确诊时间止,期间为传染期:传染期=(发病时间,确诊时间)接下来,获取确诊病例用户在传染期内的手机信令数据,并根据时间进行排序,形成病例用户的移动轨迹序列,可表示为公式①:Tramove={(x1,y1,t1),(x2,y2,t2),…,(xi,yi,ti)},公式①其中,xi和yi表示该病例在ti时刻的位置坐标。对于非确诊病例用户,获取其自疾病爆发以来的手机信令数据,并根据时间进行排序,形成非确诊病例用户的移动轨迹序列,具体形式与确诊病例用户相同。同时,基于手机的历史话单数据,提取用户之间的通话关系。步骤Ⅱ:时空共现分析及通话网络构建:该步骤的目的是基于移动轨迹,分析非确诊病例用户与确诊病例用户之间的时空共现关系(即是否相同时间在相同地点出现),因为时空共现是确诊病例与非确诊病例之间发生密切接触的前提条件,若存在共现,则有可能发生密切接触本文档来自技高网...

【技术保护点】
1.一种基于手机数据的呼吸道传染病密切接触者识别方法,其特征在于:包括以下步骤:/n步骤Ⅰ、根据呼吸道传染病的确诊病例用户及非确诊病例用户的手机信令数据和手机历史话单数据,提取移动轨迹和通话关系;/n步骤Ⅱ、根据移动轨迹分析非确诊病例用户与确诊病例用户之间的时空共现关系,判断潜在密切接触者;根据通话关系构建包括通话频次参数和通话时长参数的通话网络;/n步骤Ⅲ、结合呼吸道传染病传染机制,提取潜在密切接触者与确诊病例用户之间的时空共现特征及通话网络特征;/n步骤Ⅳ、利用已有的密切接触者数据,提取其与对应确诊病例用户之间的时空共现特征及通话网络特征,然后输入到机器学习模型,进行模型的训练及优化;/n步骤Ⅴ、将潜在密切接触者与确诊病例用户之间的时空共现特征和通话网络特征输入到步骤Ⅳ训练好的机器学习模型中,判断密切接触者和接触类型,并输出相应风险等级。/n

【技术特征摘要】
1.一种基于手机数据的呼吸道传染病密切接触者识别方法,其特征在于:包括以下步骤:
步骤Ⅰ、根据呼吸道传染病的确诊病例用户及非确诊病例用户的手机信令数据和手机历史话单数据,提取移动轨迹和通话关系;
步骤Ⅱ、根据移动轨迹分析非确诊病例用户与确诊病例用户之间的时空共现关系,判断潜在密切接触者;根据通话关系构建包括通话频次参数和通话时长参数的通话网络;
步骤Ⅲ、结合呼吸道传染病传染机制,提取潜在密切接触者与确诊病例用户之间的时空共现特征及通话网络特征;
步骤Ⅳ、利用已有的密切接触者数据,提取其与对应确诊病例用户之间的时空共现特征及通话网络特征,然后输入到机器学习模型,进行模型的训练及优化;
步骤Ⅴ、将潜在密切接触者与确诊病例用户之间的时空共现特征和通话网络特征输入到步骤Ⅳ训练好的机器学习模型中,判断密切接触者和接触类型,并输出相应风险等级。


2.根据权利要求1所述的基于手机数据的呼吸道传染病密切接触者识别方法,其特征在于:步骤Ⅰ中,对于呼吸道传染病的确诊病例用户来说,首先确定其传染期,然后获取其在传染期内的移动轨迹;对于非确诊病例用户来说,获取其自疾病爆发以来的移动轨迹;
对于潜伏期内就具有传染性的疾病来说,以发病时间减去最大潜伏期起,至确诊时间止,期间为传染期;
对于潜伏期内不具有传染性的疾病来说,以发病时间起,至确诊时间止,期间为传染期。


3.根据权利要求1或2所述的基于手机数据的呼吸道传染病密切接触者识别方法,其特征在于:应用移动轨迹序列来表示移动轨迹以便于后续计算;将手机信令数据根据时间进行排序形成移动轨迹序列,移动轨迹序列如公式①...

【专利技术属性】
技术研发人员:裴韬刘亚溪宋辞王席陈洁舒华陈晓黄强吴明柏郭思慧周成虎
申请(专利权)人:中国科学院地理科学与资源研究所
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1