基于图数据的传染病传播链路溯源和风险预警系统及方法技术方案

技术编号:38468136 阅读:10 留言:0更新日期:2023-08-11 14:45
本发明专利技术属于大数据领域,特别涉及一种基于图数据的传染病传播链路溯源和风险预警系统及方法,该方法包括:通过流调模块接入流调数据,通过外部数据采集模块接入疫苗接种、核酸检测数据;通过场所码模块接入场所码扫码日志数据、场所码扫码人员和场所码数据;通过离线和实时ETL数据处理组件将关系型数据库RDS和消息队列MQ的数据清洗和整合;按照图数据模型将处理好的数据导入分布式图数据库中;利用图计算算法引擎对分布式图数据库的图数据进行加工处理,计算节点风险系数;通过可视化查询分析交互界面查询传播链路、风险因素以及设置阈值启动风险预警提醒。本发明专利技术利用多数据源的大数据、引入分布式图数据库,提高了防控效率,实现风险预警提醒。实现风险预警提醒。实现风险预警提醒。

【技术实现步骤摘要】
基于图数据的传染病传播链路溯源和风险预警系统及方法


[0001]本专利技术属于大数据领域,特别涉及一种基于图数据的传染病传播链路溯源和风险预警系统及方法。

技术介绍

[0002]从古至今瘟疫、疫情总是给人类带来很大的损失,随着经验的积累和科学技术发展,如今人类可以利用医学知识和信息化工具对疫情进行有效的干预,进而控制疫情产生的影响。其中,疫情传播溯源就是一个十分关键的措施,其指的是利用各种技术,从已知疫情发生的人地间建立关联,反向地向上追溯疫情源头的过程。近几年的疫情中,有大数据技术支持疫情传播链路溯源发挥了极大的作用,卫生防控部门可以快速锁定风险人或地,采取相应的防疫措施,从而大大减少疫情扩散。
[0003]作为疫情传播溯源一项重要的数据来源就是卫生防控部门对疫情中病例等的流调(流行病学调查),此项调查主要以人工打电话为主,了解行程轨迹,建立密接(密切接触人)台账,然而这不能解决时效性低、筛查效率低、被流调人谎报行程等问题。同时,现实世界中疫情传播的复杂性,使得流调数据可能时刻都在动态更新,鉴于疫情对于数据的高时效性要求,利用关系型数据库需要每次实时关联查询几张或者自关联来获得结果,尤其是从病例到次密接的多层次管理查询,关系型数据库在处理能力上显得力不从心。
[0004]此外,流调数据是基于事实收集产生的数据,但是下一步如何采取措施目前只能靠流调人员和卫生防控人员自行根据经验判断,在大规模疫情发生时,由于流调和卫生防控人员的扩充导致经验不足的判断时常发生,从而降低整体防控效率。所以基于流调溯源进行风险分析判断和预警是一项迫切需求,可以提高整体卫生防控效率。
[0005]现有的技术方案无法解决以下几个重要问题:1.流调过程中效率低、谎报瞒报漏报行程的情况无法佐证。
[0006]2.图数据库建模内容较少,一般只有病例和密接人员以及接触关系,没有有效利用大数据能力,且现有方案中一般采取单节点图数据库,面对大数据量图数据时查询处理能力有瓶颈。
[0007]3. 可视化查询只支持现有事实的检索,不具备风险分析预警提示,无法改善工作人员凭个人经验进行判断,导致采取了效率不高的下一步措施。

技术实现思路

[0008]针对现有技术中存在的问题,本专利技术提出一种基于图数据的传染病传播链路溯源和风险预警系统及方法,以解决流调工作中调查耗时、被调查者对行程瞒报漏报等情况的发生,无法有效利用多数据源的大数据进行图数据库建模设计,单节点图数据库处理大数量图数据时查询处理能力差,不具备风险预警的能力。
[0009]为了实现上述目的,本专利技术采用以下的技术方案:本专利技术提供了一种基于图数据的传染病传播链路溯源和风险预警系统,包括数据
源模块、业务数据存储模块、图数据处理模块、图数据服务模块和功能应用模块;数据源模块,包括流调模块、场所码模块和外部数据采集模块,通过流调模块输入流调数据,通过场所码模块输入场所码扫码日志数据、场所码扫码人员和场所码数据,通过外部数据采集模块输入疫苗接种、核酸检测数据;业务数据存储模块,存储通过数据源模块接入的流调数据、场所码扫码日志数据、场所码扫码人员、场所码数据和外部结构化数据;图数据处理模块,包括离线和实时ETL数据处理组件和图计算算法引擎,通过离线和实时ETL数据处理组件将业务数据存储模块的数据清洗和整合,并且利用图计算算法引擎对分布式图数据库的图数据进行加工计算,计算节点风险系数,并将结果写回分布式图数据库;图数据服务模块,包括分布式图数据库和图数据查询接口,分布式图数据库存储图数据处理模块处理及算法加工过的数据,图数据查询接口提供只读的REST API接口供功能应用模块使用;功能应用模块,通过可视化查询分析交互界面查询传播链路、风险因素以及设置阈值启动风险预警提醒。
[0010]进一步地,所述流调数据包括病例人员和密接次密接人员基础信息、病例到访场所数据以及与病例的接触信息;所述场所码扫码日志数据是市民在到访地点扫场所码二维码签到的数据,包括市民身份、到访场所和到访时间。
[0011]进一步地,所述业务数据存储模块包括关系型数据库RDS和消息队列MQ,所述关系型数据库RDS用于存储流调数据、外部结构化数据、场所码扫码人员和场所码数据,所述消息队列MQ用于存储场所码扫码日志数据。
[0012]进一步地,所述图数据处理模块利用Spark集群进行离线数据处理并写入分布式图数据库,利用Spark Streaming进行实时数据处理并写入分布式图数据库。
[0013]本专利技术还提供了一种基于图数据的传染病传播链路溯源和风险预警方法,包含以下步骤:通过流调模块接入流调数据,通过外部数据采集模块接入疫苗接种、核酸检测数据,并存入关系型数据库RDS;通过场所码模块接入场所码扫码日志数据、场所码扫码人员和场所码数据,场所码扫码日志数据存入消息队列MQ,场所码扫码人员和场所码数据存入关系型数据库RDS;通过离线和实时ETL数据处理组件将关系型数据库RDS和消息队列MQ的数据清洗和整合;按照图数据模型将处理好的数据导入分布式图数据库中;利用图计算算法引擎对分布式图数据库的图数据进行加工处理,计算节点风险系数;通过可视化查询分析交互界面查询传播链路、风险因素以及设置阈值启动风险预警提醒。
[0014]进一步地,所述通过流调模块接入流调数据,通过外部数据采集模块接入疫苗接种、核酸检测数据,并存入关系型数据库RDS,包括:首先疾控部门将确诊病例信息录入流调模块,形成一个确诊病例的流调个案,接
着流调人员通过流调模块受理这个流调个案,开展密接人员、次密接人员以及地点流调工作,将信息记录到流调模块;当流调人员完成一个流调个案,流调模块的流调数据会通过实时同步服务DTS传输到关系型数据库RDS中;同时,外部数据采集模块的疫苗接种、核酸检测数据通过库表离线传输组件DataX写入关系型数据库RDS;所述通过场所码模块接入场所码扫码日志数据、场所码扫码人员和场所码数据,场所码扫码日志数据存入消息队列MQ,场所码扫码人员和场所码数据存入关系型数据库RDS,包括:市民通过支付宝、微信或者市政APP扫描识别场所码二维码,首次扫码会进行身份信息登记和实名认证,之后的扫码会自动通过二维码中的场所唯一识别ID、扫码人唯一识别ID、扫码时间记录组合出一条人员到访场所扫码记录,同时将这条记录以JSON形式推送给消息队列MQ存储;此外,场所码扫码人员和场所码数据利用DTS被实时同步到关系型数据库RDS。
[0015]进一步地,离线ETL数据处理过程包括:首先利用Spark定时读取关系型数据库RDS中的数据,形成Spark内部数据集;然后对其中的关键字段是否符合规范进行校验,利用正则表达式将关键字段数据进行过滤和清洗,最终得到清洗后的各数据集;利用标准地址唯一识别ID将流调数据和场所码数据的地址信息组成并集形成地址数据集;通过证件号码、手机号将流调数据、场所码扫码人员、疫苗接种、核酸检测数据中的人员身份信息关联,取并集且去除重复数据,形成人员数据集;基于地址数据集和人员数据集,对各本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于图数据的传染病传播链路溯源和风险预警系统,其特征在于,包括数据源模块、业务数据存储模块、图数据处理模块、图数据服务模块和功能应用模块;数据源模块,包括流调模块、场所码模块和外部数据采集模块,通过流调模块输入流调数据,通过场所码模块输入场所码扫码日志数据、场所码扫码人员和场所码数据,通过外部数据采集模块输入疫苗接种、核酸检测数据;业务数据存储模块,存储通过数据源模块接入的流调数据、场所码扫码日志数据、场所码扫码人员、场所码数据和外部结构化数据;图数据处理模块,包括离线和实时ETL数据处理组件和图计算算法引擎,通过离线和实时ETL数据处理组件将业务数据存储模块的数据清洗和整合,并且利用图计算算法引擎对分布式图数据库的图数据进行加工计算,计算节点风险系数,并将结果写回分布式图数据库;图数据服务模块,包括分布式图数据库和图数据查询接口,分布式图数据库存储图数据处理模块处理及算法加工过的数据,图数据查询接口提供只读的REST API接口供功能应用模块使用;功能应用模块,通过可视化查询分析交互界面查询传播链路、风险因素以及设置阈值启动风险预警提醒。2.根据权利要求1所述的基于图数据的传染病传播链路溯源和风险预警系统,其特征在于,所述流调数据包括病例人员和密接次密接人员基础信息、病例到访场所数据以及与病例的接触信息;所述场所码扫码日志数据是市民在到访地点扫场所码二维码签到的数据,包括市民身份、到访场所和到访时间。3.根据权利要求1所述的基于图数据的传染病传播链路溯源和风险预警系统,其特征在于,所述业务数据存储模块包括关系型数据库RDS和消息队列MQ,所述关系型数据库RDS用于存储流调数据、外部结构化数据、场所码扫码人员和场所码数据,所述消息队列MQ用于存储场所码扫码日志数据。4.根据权利要求1所述的基于图数据的传染病传播链路溯源和风险预警系统,其特征在于,所述图数据处理模块利用Spark集群进行离线数据处理并写入分布式图数据库,利用Spark Streaming进行实时数据处理并写入分布式图数据库。5.一种基于图数据的传染病传播链路溯源和风险预警方法,其特征在于,包含以下步骤:通过流调模块接入流调数据,通过外部数据采集模块接入疫苗接种、核酸检测数据,并存入关系型数据库RDS;通过场所码模块接入场所码扫码日志数据、场所码扫码人员和场所码数据,场所码扫码日志数据存入消息队列MQ,场所码扫码人员和场所码数据存入关系型数据库RDS;通过离线和实时ETL数据处理组件将关系型数据库RDS和消息队列MQ的数据清洗和整合;按照图数据模型将处理好的数据导入分布式图数据库中;利用图计算算法引擎对分布式图数据库的图数据进行加工处理,计算节点风险系数;通过可视化查询分析交互界面查询传播链路、风险因素以及设置阈值启动风险预警提醒。
6.根据权利要求5所述的基于图数据的传染病传播链路溯源和风险预警方法,其特征在于,所述通过流调模块接入流调数据,通过外部数据采集模块接入疫苗接种、核酸检测数据,并存入关系型数据库RDS,包括:首先疾控部门将确诊...

【专利技术属性】
技术研发人员:张帆安家威辛昌浩杜超安娜郝亮王超然
申请(专利权)人:数字郑州科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1