基于图神经网络的人兽共患病风险预测模型的构建方法技术

技术编号：41298234 阅读：4 留言：0更新日期：2024-05-13 14:46

本发明专利技术提供了一种基于图神经网络的人兽共患病风险预测模型的构建方法，包括：根据研究区的目标地区和邻近地区的病例数时间序列的相关性构建不同地区间的疫情交互作用图；将邻近地区的特征变量时间序列输入至疫情交互作用图，通过多层图卷积网络进行特征聚合，得到一个聚合后的特征时间序列；将聚合后的特征时间序列和目标地区的特征变量时间序列一起输入到多层的长短期记忆网络中；基于均方根误差对不同超参数组合下的预测模型进行精度评估和筛选得到最优的预测模型。本发明专利技术弥补了前人预测模型中忽略地区间疫情时空关联对目标地区疫情波动影响这一缺陷，能够更好地捕捉和预测目标地区的登革热在时间序列波动趋势。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及模型构建，特别是涉及一种基于图神经网络的人兽共患病风险预测模型的构建方法。

技术介绍

1、随着全球气候变化、城市化与人口增长，人兽共患病的新发再发风险不断升高。其中，登革热是一个典型案例，其传播的空间范围在不断扩大，造成人类巨大的疾病负担。发展及时、准确的传播风险预测模型，能够为登革热防疫的决策制定与资源分配提供科学依据。

2、目前，已经发展了一系列基于数据驱动和人工智能方法的登革热风险预测模型。前人研究通常认为目标节点（例如某个城市）的气象环境因素主要影响着当地的登革热疫情，因此将登革热的历史病例数或历史发病率作为标签，基于地理空间大数据或者气象站点数据计算气温、降雨、相对湿度、植被绿度等气象环境因素作为协变量，在不同时间尺度上（例如流行病学周或自然月）构建模型来预测目标节点未来的登革热病例数。上述模型通常包括多种机器学习（如随机森林、xgboost等）或者深度学习模型（如gru、lstm、transformer等）。

3、上述方法均是以目标节点自身的气候环境因素作为特征，以病例数或发病率作为标签来进行模型的训练、参数调整和性能测试。然而，在一个疫情热点地区内，目标节点的疫情波动不仅受到节点自身气候环境因素的影响，还受到所在与它相邻的节点（例如目标城市的邻近城市）的疫情波动影响。此外，这些邻近节点自身的疫情波动又受到其自身气候环境条件波动的影响。前述登革热预测模型未将上述的节点之间的时空关联考虑到未来风险预测中。

技术实现思路

1、为了克服现

2、为实现上述目的，本专利技术提供了如下方案：

3、一种基于图神经网络的人兽共患病风险预测模型的构建方法，包括：

4、对研究区域内目标地区和邻近地区的特征变量（历史病例数和气候环境因素）数据进行预处理，得到目标数据集；

5、根据目标地区的历史病例数与其邻近地区的历史病例数的相关性构建地区间的疫情交互作用图；

6、将邻近地区的气候环境因素和历史病例数据输入至疫情交互作用图，通过多层图卷积网络中进行特征聚合，得到聚合后的特征；

7、将聚合后的特征和所述目标地区的气候环境因素和历史病例数据输入到多层的长短期记忆网络中，并基于初始的超参数对所述多层的长短期记忆网络的损失函数进行权重更新，得到相应超参数组合下的预测模型；

8、利用网格搜索法枚举并更新初始的超参数，得到不同超参数组合下的预测模型；

9、基于均方根误差对不同超参数组合下的预测模型进行模型精度评估得到最优的预测模型。

10、利用所述最优的预测模型对目标区域人兽共患病风险进行预测，得到预测结果。

11、优选的，对研究区域内目标地区和邻近地区的特征变量数据进行预处理，得到目标数据集，包括：

12、获取研究区域内目标地区和邻近地区的特征变量（历史病例数和气候环境因素）数据；所述特征变量数据包括每个地区的特征矩阵；所述特征矩阵包含病例数时间序列、多种气候环境特征时间序列；

13、对所述目标地区和所述邻近地区的预设的病例数据进行自然对数转化，对所有特征变量的数据进行数值归一化，形成所述目标数据集。

14、优选的，所述目标数据集的大小为地区数量n*特征数量f*时间序列长度t。

15、优选的，所述疫情交互作用图的表达形式是g=（v，e）；其中v为所有地区的所述特征矩阵，e为根据地区的拓扑数据得到的两两节点之间的边；所述疫情交互作用图的每一个节点均代表该地区在某一时刻的病例数，每一条边代表两个地区间的病例数相关性。

16、优选的，对于每一个给定的所述节点，每一层图卷积网络用于迭代地聚合所述节点的一阶邻域的特征信息（历史病例数和气候环境因素），以学习所述节点的特征向量其中，和是第次迭代时 v节点与 u节点的特征信息；代表用于聚集来自其邻接节点的病例信息的函数；代表将得到的特征信息聚合至当前节点。

17、优选的，所述损失函数的公式为：来进行模型的权重更新；其中, n为所有城市的数量， q为给定的预测时刻，为预测结果与真实数据的均方误差损失函数，为惩罚项，λ为平衡两部分损失的参数。

18、根据本专利技术提供的具体实施例，本专利技术公开了以下技术效果：

19、本专利技术基于目标地区与其邻近地区之间疫情的时空关联图，采用图卷积网络gcn将邻近地区的气候环境因素和历史疫情波动纳入到目标地区疫情的长短时记忆网络lstm中，弥补了前人预测模型中忽略地区间疫情时空关联对目标地区疫情波动影响这一缺陷，能够更好地捕捉和预测目标地区的登革热在时间序列波动趋势。

本文档来自技高网...

【技术保护点】

1.一种基于图神经网络的人兽共患病风险预测模型的构建方法，其特征在于，包括：

2.根据权利要求1所述的基于图神经网络的人兽共患病风险预测模型的构建方法，其特征在于，对研究区域内目标地区和其邻近地区的特征变量的数据进行预处理，得到目标数据集，包括：

3.根据权利要求2所述的基于图神经网络的人兽共患病风险预测模型的构建方法，其特征在于，所述目标数据集的大小为地区数量N*特征数量F*时间序列长度T。

4.根据权利要求2所述的基于图神经网络的人兽共患病风险预测模型的构建方法，其特征在于，所述疫情交互作用图的表达形式是G=（V，E）；其中V为所有地区的所述特征矩阵，E为根据地区的拓扑数据得到的两两节点之间的边；所述疫情交互作用图的每一个节点均代表该地区在某一时刻的病例数，每一条边代表两个地区间的病例数相关性。

5.根据权利要求1所述的基于图神经网络的人兽共患病风险预测模型的构建方法，其特征在于，对于每一个给定的所述节点，每一层图卷积网络用于迭代地聚合所述节点的一阶邻域的特征信息，以学习所述节点的特征向量其中，和是第次迭代时v节点与u节点的特征

6.根据权利要求5所述的基于图神经网络的人兽共患病风险预测模型的构建方法，其特征在于，所述损失函数的公式为：来进行模型的权重更新；其中，n为所有城市的数量，q为给定的预测时刻，为预测结果与真实数据的均方误差损失函数，为惩罚项，λ为平衡两部分损失的参数。

...

【技术特征摘要】

1.一种基于图神经网络的人兽共患病风险预测模型的构建方法，其特征在于，包括：

3.根据权利要求2所述的基于图神经网络的人兽共患病风险预测模型的构建方法，其特征在于，所述目标数据集的大小为地区数量n*特征数量f*时间序列长度t。

4.根据权利要求2所述的基于图神经网络的人兽共患病风险预测模型的构建方法，其特征在于，所述疫情交互作用图的表达形式是g=（v，e）；其中v为所有地区的所述特征矩阵，e为根据地区的拓扑数据得到的两两节点之间的边；所述疫情交互作用图的每一个节点...

【专利技术属性】
技术研发人员：李之超，
申请(专利权)人：中国科学院地理科学与资源研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人