一种基于网络结构的疾病动态预测方法技术

技术编号:15500930 阅读:113 留言:0更新日期:2017-06-03 22:32
本发明专利技术公开了一种基于网络结构的疾病动态预测方法,首先通过分析由疫情地区的志愿者携带的移动设备采集的大量时空数据来评估网络结构对疾病动态的影响,采用聚类系数、度分布和度相关性三个特性来刻画网络结构,然后基于该评估的结果,设计结构识别模型识别动态变化的网络结构,最后根据疾病动态性和网络结构的关系模型预测出疾病的动态变化。本发明专利技术能够有效地提高疾病预测的准确性,对传染病控制和预防有着重要意义。

A method of disease dynamic prediction based on network structure

The invention discloses a method for predicting disease dynamics based on network structure, firstly to evaluate the effect of network structure on the dynamic analysis of a large number of spatio-temporal data of disease outbreak area carried by the mobile device volunteers collection, correlation degree distribution and clustering coefficient, three characters to depict the network structure is adopted, then the evaluation based on the results of network structure dynamic model identification design structure recognition, according to the dynamic relationship between disease model dynamic and network structure to predict disease. The invention can effectively improve the accuracy of disease prediction, and is of great significance to the control and prevention of infectious diseases.

【技术实现步骤摘要】
一种基于网络结构的疾病动态预测方法
本专利技术涉及一种基于网络结构的疾病动态预测方法,属于基于信息处理的传染病控制、预测

技术介绍
在传染病爆发期间,能够准确地预测疾病的动态性是传染病控制、预测的一个非常重要的方面,通过准确地预测,可以合理、有效地对医疗资源进行配置,从而对公共医疗事件做出合理而快速的响应。对于公共医疗事件,低估了疫情的影响可能会导致不能及时采取有效地措施,而过高的估计又会导致有限资源的不合理分配。因此准确的预测疾病的动态变化及影响具有重大的现实意义。在疾病流行期间,传染病例的繁殖数量R可作为量化疾病动态性变化的标准。目前,已经提出了许多算法,通过分析挖掘监测数据来估算或预测R的值。然而,大部分的现有方法都是基于接触网络所具有的某种特定的网络结构,例如,呈指数分布的网络结构。现实接触网络(RCNs)的网络结构随着疾病的传播动态变化,因此准确地获取相关RCNs的动态变化的结构将有利于提高疾病动态预测的精度,随着智能移动设备在公共医疗中的普及应用,获取网络结构的动态变化成为可能。
技术实现思路
为了克服现有技术中存在的不足,本专利技术提供一种基于网络结构的疾病动态预测方法,可以有效地提高疾病预测的准确性。为了解决上述技术问题,本专利技术采用的技术方案为:一种基于网络结构的疾病动态预测方法,包括以下步骤:1)志愿者手持安装有接触跟踪应用的智能移动设备,只要直接接触传染病患者,通过该手持设备,这次接触的时间、地点就能被提交到疾病控制中心,记录在数据库中;2)从数据库中选取一定时间一定区域的数据,构造接触网络为动态图Gt=(Vt,Et,Wt),其中,Gt表示动态图,Vt表示以病例为图顶点的顶点集合,Et表示动态图中边的集合,Et中包含元素eij表示顶点i和顶点j之间的边,Wt表示权值的集合,Wt中包含元素wij表示疾病从顶点i到顶点j的传播概率;所述构造的接触网络中包含四个参数:(a)病例ID;(b)传染源的ID;(c)病例被感染的日期;(d)病例所在的位置;3)构造三个结构特性:聚类系数、度分布和度相关性,来评估接触网络结构对疾病动态的影响;4)设计识别模型来获取接触网络的结构,所述识别模型包括测量模块和信息获取模块;所述测量模块计算聚类系数、度分布和度相关性以及节点度的期望,节点度集合的期望和两个节点度的联合概率分布的期望;所述信息获取模块将节点度的期望,节点度集合的期望和两个节点度的联合概率分布的期望进行融合;5)预测疾病的动态变化,包括以下步骤:5-1)通过识别模型获取接触网络结构与信息;5-2)通过SRM估算传染病繁殖数量。前述的动态图Gt可在线实时更新,主要步骤如下:(2-1)删除eij:从Et中删除边eij,从Vt中删除相应的顶点i和j;(2-2)插入eij:将边eij插入到集合Et中,将相应的顶点i和j插入到Vt中;(2-3)更新权值wij。前述的聚类系数用于表征动态图中顶点倾向于聚集在一起的程度,公式如下:其中,为聚类系数,si为强度,即节点i的临边的权值的总和,ki为节点i的度,wij,wih分别为边eij,eih的权值,aij,aih,ajh为接触网络相邻矩阵的元素。前述的度分布表征接触网络中节点度的概率分布,度分布用节点度集合的期望来表示:E[X]=k1p1+k2p2+...+knpn(2)其中,E[X]表示度分布,X={k1,k2,...,ki,...kn}为节点度的集合,ki为节点i的度,n表示节点数,P={p1,p2,...,pi,...pn'}为概率的集合,pi为ki出现的概率。前述的度相关性测量接触网络的同质性程度,度相关性表示为:其中,r表示度相关性,εjk是随机选择的边ejk的两个节点j和k的度的联合概率分布,这个数值在无向网络中是对称的,即εjk=εkj,并遵循以下规则:其中,ki+1是节点i+1的度;公式中符号j,k是一个常数值,在实际计算中,将节点j和k对应的度作为数值赋予参数j和k。前述的步骤5)获取接触网络结构与信息是指:计算每个节点i的聚类系数采用函数graph.strength(.)收集动态图Gt中每个节点i的强度si,得到:Si=graph.strength(Gt)(5)Si是接触网络中所有节点的强度的集合;然后计算出每个节点i的度、度分布及度相关性;采用函数get.edges(.)收集动态图Gt的所有边的集合,即:Et=get.edges(.)(6)根据公式(7)计算节点度的期望:其中,ki为节点i的度,aij,aih,ajh为接触网络相邻矩阵的元素;根据公式(8)计算两个节点度的联合概率分布的期望E[εjk]:结合三个与网络中节点度相关的期望E[ki],E[X],E[εjk],得:E[X]为节点度集合的期望。前述的步骤4)通过空间风险模型估算传染病繁殖数量公式为:SRM(β=M,γ=M,no.iteration)(9)其中,no.iteration用来表明迭代次数。本专利技术能够有效地提高疾病预测的准确性,对传染病控制、预测在实际生活中的应用有着重要意义。附图说明图1为动态接触网络的片段。图2为聚类系数与疾病动态性的关系。图3为度分布与疾病动态性的关系。图4为度相关性与疾病动态的关系。图5为对比实验结果。具体实施方式下面结合附图对本专利技术作进一步描述。以下实施例仅用于更加清楚地说明本专利技术的技术方案,而不能以此来限制本专利技术的保护范围。本专利技术方法步骤如下:步骤一:评估网络结构对疾病动态的影响在本专利技术中,从三个典型的埃博拉病毒疫情国家几内亚、尼日利亚和利比里亚中选取七个区域的数据,通过这些数据构造接触网络。在疾病流行期间,随着疾病的传播,接触网络被逐步构建,随着时间的推移,传染病不断扩散,通过逐步构建的网络,能够清楚地了解疾病的传播过程。将接触网络建模为动态图Gt=(Vt,Et,Wt),其中,Gt表示动态图,Vt表示以病例为图顶点的顶点集合,Et表示动态图中边的集合,Et中的元素eij表示顶点i和顶点j之间的边,Wt表示权值的集合,Wt中的元素wij表示疾病从顶点i到顶点j(即相应的边eij上)的传播概率。在该网络中包含四个参数:(1)病例ID;(2)传染源的ID;(3)病例被感染的日期;(4)病例所在的位置。该动态图可以在线实时更新,主要步骤如下:(1)删除eij:从Et中删除边eij,从Vt中删除相应的顶点i和j;(2)插入eij:将边eij插入到集合Et中,将相应的顶点i和j插入到Vt中;(3)更新权值wij。基于以上三个步骤,动态图从Gt=(Vt,Et,Wt)更新为Gt+1=(Vt+1,Et+1,Wt+1)。也就意味着在不同的时间点,随着疾病的传播,各个子网络是不同的,因此该接触网络是一个时变网络。本专利技术采用空间风险模型来评估网络结构对疾病动态的影响,计算传染病繁殖数量R,参数R用来量化疾病流行期间疾病的动态变化。本专利技术中,在真实的监测数据中随机采样100个时间段构造成100个不同的子网络。为了评估网络结构对疾病动态的影响,采用以下三个结构特性来描述:聚类系数、度分布和度相关性。1.聚类系数聚类系数用于表征动态图中顶点倾向于聚集在一起的程度,其定义如下式:其中,为聚类系数,si为强度,即节点i的临边的权值的总和,ki为节点i的度,wi本文档来自技高网...
一种基于网络结构的疾病动态预测方法

【技术保护点】
一种基于网络结构的疾病动态预测方法,其特征在于,包括以下步骤:1)志愿者手持安装有接触跟踪应用的智能移动设备,只要直接接触传染病患者,通过该手持设备,这次接触的时间、地点就能被提交到疾病控制中心,记录在数据库中;2)从数据库中选取一定时间一定区域的数据,构造接触网络为动态图G

【技术特征摘要】
1.一种基于网络结构的疾病动态预测方法,其特征在于,包括以下步骤:1)志愿者手持安装有接触跟踪应用的智能移动设备,只要直接接触传染病患者,通过该手持设备,这次接触的时间、地点就能被提交到疾病控制中心,记录在数据库中;2)从数据库中选取一定时间一定区域的数据,构造接触网络为动态图Gt=(Vt,Et,Wt),其中,Gt表示动态图,Vt表示以病例为图顶点的顶点集合,Et表示动态图中边的集合,Et中包含元素eij表示顶点i和顶点j之间的边,Wt表示权值的集合,Wt中包含元素wij表示疾病从顶点i到顶点j的传播概率;所述构造的接触网络中包含四个参数:(a)病例ID;(b)传染源的ID;(c)病例被感染的日期;(d)病例所在的位置;3)构造三个结构特性:聚类系数、度分布和度相关性,来评估接触网络结构对疾病动态的影响;4)设计识别模型来获取接触网络的结构,所述识别模型包括测量模块和信息获取模块;所述测量模块计算聚类系数、度分布和度相关性以及节点度的期望,节点度集合的期望和两个节点度的联合概率分布的期望;所述信息获取模块将节点度的期望,节点度集合的期望和两个节点度的联合概率分布的期望进行融合;5)预测疾病的动态变化,包括以下步骤:5-1)通过识别模型获取接触网络结构与信息;5-2)通过SRM估算传染病繁殖数量。2.根据权利要求1所述的一种基于网络结构的疾病动态预测方法,其特征在于,所述动态图Gt可在线实时更新,主要步骤如下:(2-1)删除eij:从Et中删除边eij,从Vt中删除相应的顶点i和j;(2-2)插入eij:将边eij插入到集合Et中,将相应的顶点i和j插入到Vt中;(2-3)更新权值wij。3.根据权利要求1所述的一种基于网络结构的疾病动态预测方法,其特征在于,所述聚类系数用于表征动态图中顶点倾向于聚集在一起的程度,公式如下:其中,为聚类系数,si为强度,即节点i的临边的权值的总和,ki为节点i的度,wij,wih分别为边eij,eih的权值,aij,aih,ajh为接触网络相邻矩阵的元素。4.根据权利要求1所述的一种基于网络结构的疾病动态预测方法,其特征在于,所述度分布表征接触网络中节点度的概率分布,度分布用节点度集合的期望来表示:E[X]=k1p1+k2p2+...+knpn(2)其中,E[X]表示度分布,X={k1,k2,.....

【专利技术属性】
技术研发人员:陈媛芳舒磊言理
申请(专利权)人:广东石油化工学院
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1