模型训练方法、感染人数预测方法、介质及设备技术

技术编号:37312835 阅读:17 留言:0更新日期:2023-04-21 22:55
本公开提供一种模型训练方法、感染人数预测方法、存储介质及电子设备;涉及人工智能技术领域。所述方法包括:获取目标传染病的第一特征数据,所述第一特征数据包括所述目标传染病的多个影响因素集合和感染人数;根据各所述影响因素集合和所述感染人数构建与各所述影响因素集合对应的感染人数预测模型;利用所述多个影响因素集合和所述感染人数对各所述感染人数预测模型进行训练,得到非标注数据上方差最小的各所述感染人数预测模型,并利用训练好的各所述感染人数预测模型预测该传染病在目标时间段内的感染人数。本公开可以提升感染人数预测模型的预测性能,进而提高感染人数预测的准确性。测的准确性。测的准确性。

【技术实现步骤摘要】
模型训练方法、感染人数预测方法、介质及设备


[0001]本公开涉及人工智能
,具体而言,涉及一种模型训练方法、感染人数预测方法、计算机可读存储介质以及电子设备。

技术介绍

[0002]当某一地区发生传染病时,准确地预测传染病的感染人数对于控制传染病具有重要意义。比如通过预测感染人数,便于提前做好疾病预防和医疗救助措施,从而减缓或阻止疾病的传播。
[0003]需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现思路

[0004]本公开提供一种模型训练方法、感染人数预测方法、计算机可读存储介质以及电子设备,进而至少在一定程度上克服由于感染人数预测模型的预测性能较差而导致感染人数预测的准确性较低的问题。
[0005]根据本公开的第一方面,提供一种模型训练方法,包括:
[0006]获取目标传染病的第一特征数据,所述第一特征数据包括所述目标传染病的多个影响因素集合和感染人数;
[0007]根据各所述影响因素集合和所述感染人数构建与各所述影响因素集合对应的感染人数预测模型;
[0008]利用所述多个影响因素集合和所述感染人数对各所述感染人数预测模型进行训练,得到非标注数据上方差最小的各所述感染人数预测模型。
[0009]在本公开的一种示例性实施例中,获取目标传染病的第一特征数据之前,所述方法还包括:
[0010]获取所述目标传染病的原始特征数据,所述原始特征数据包括所述目标传染病的多个影响因素和所述感染人数;
[0011]基于所述多个影响因素和所述感染人数通过启发式搜索方式确定所述多个影响因素集合。
[0012]在本公开的一种示例性实施例中,所述多个影响因素集合至少包括第一影响因素集合和第二影响因素集合;
[0013]所述基于所述多个影响因素和所述感染人数通过启发式搜索方式确定所述多个影响因素集合,包括:
[0014]构造第一空集和第二空集;
[0015]轮询各所述影响因素,计算各所述影响因素、所述感染人数、所述第一空集和所述第二空集之间的关联性;
[0016]确定所述关联性满足预设关联条件的目标影响因素,并根据所述目标影响因素更
新所述第一空集和所述第二空集,得到所述第一影响因素集合和所述第二影响因素集合。
[0017]在本公开的一种示例性实施例中,所述根据各所述影响因素集合和所述感染人数构建与各所述影响因素集合对应的感染人数预测模型,包括:
[0018]根据各所述影响因素集合和所述感染人数之间的对应关系得到各所述影响因素集合对应的标注数据和非标注数据;
[0019]根据各所述影响因素集合对应的所述标注数据确定所述标注数据服从的第一高斯分布;
[0020]根据各所述影响因素集合对应的所述非标注数据确定所述非标注数据服从的第二高斯分布;
[0021]对所述第一高斯分布和所述第二高斯分布进行联合分布计算,得到各所述感染人数预测模型。
[0022]在本公开的一种示例性实施例中,所述根据各所述影响因素集合对应的所述标注数据确定所述标注数据服从的第一高斯分布,包括:
[0023]向量化所述标注数据中的各所述影响因素,得到多个影响因素向量;
[0024]利用预设的网络模型对任意两个所述影响因素向量进行计算,得到所述标注数据对应的协方差矩阵;
[0025]根据预设的均值向量和所述协方差矩阵确定所述第一高斯分布。
[0026]在本公开的一种示例性实施例中,所述利用所述多个影响因素集合和所述感染人数对各所述感染人数预测模型进行训练,得到非标注数据上方差最小的各所述感染人数预测模型,包括:
[0027]根据所述多个影响因素集合和所述感染人数之间的对应关系得到所述多个影响因素集合对应的标注数据和非标注数据;
[0028]获取所述标注数据对应的感染人数分布和所述非标注数据对应的方差;
[0029]根据所述感染人数分布和所述方差构建目标函数;
[0030]基于所述目标函数,利用梯度下降算法对各所述感染人数预测模型的模型参数进行迭代更新,当满足预设的迭代终止条件时,得到所述非标注数据上方差最小的各所述感染人数预测模型。
[0031]在本公开的一种示例性实施例中,得到非标注数据上方差最小的各所述感染人数预测模型之后,所述方法还包括:
[0032]将所述非标注数据输入各所述感染人数预测模型中,得到多个预测值集合;
[0033]利用各所述预测值集合中出现概率大于预设概率阈值的所述预测值更新各所述感染人数预测模型的训练数据集;
[0034]利用更新后的所述训练数据集对各所述感染人数预测模型的模型参数进行迭代更新,当满足预设的迭代终止条件时,完成对各所述感染人数预测模型的训练。
[0035]根据本公开的第二方面,提供一种感染人数预测方法,包括:
[0036]获取目标传染病的第二特征数据,所述第二特征数据包括目标时间段内所述目标传染病的多个影响因素集合;
[0037]将所述多个影响因素集合输入训练好的多个感染人数预测模型中,根据各所述感染人数预测模型的输出结果确定所述目标时间段内的感染人数。
[0038]在本公开的一种示例性实施例中,所述将所述多个影响因素集合输入训练好的多个感染人数预测模型中,根据各所述感染人数预测模型的输出结果确定所述目标时间段内的感染人数,包括:
[0039]将所述多个影响因素集合输入训练好的各所述感染人数预测模型中,得到所述多个影响因素集合对应的感染人数分布的多个均值参数;
[0040]对各所述均值参数进行加权求和得到所述目标时间段内的感染人数。
[0041]在本公开的一种示例性实施例中,确定所述目标时间段内的感染人数之后,所述方法还包括:
[0042]将所述目标时间段内的感染人数的预测结果输出至终端设备。
[0043]根据本公开的第三方面,提供一种模型训练装置,包括:
[0044]数据获取模块,用于获取目标传染病的第一特征数据,所述第一特征数据包括所述目标传染病的多个影响因素集合和感染人数;
[0045]模型构建模块,用于根据各所述影响因素集合和所述感染人数构建与各所述影响因素集合对应的感染人数预测模型;
[0046]模型训练模块,用于利用所述多个影响因素集合和所述感染人数对各所述感染人数预测模型进行训练,得到非标注数据上方差最小的各所述感染人数预测模型。
[0047]根据本公开的第四方面,提供一种感染人数预测装置,包括:
[0048]数据获取模块,用于获取目标传染病的第二特征数据,所述第二特征数据包括目标时间段内所述目标传染病的多个影响因素集合;
[0049]人数预测模块,用于将所述多个影响因素集合输入训练好的多个感染人数预测模型中,根据各所述感染人数预测模型的输出结果确定所述目标时间段内本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法,其特征在于,包括:获取目标传染病的第一特征数据,所述第一特征数据包括所述目标传染病的多个影响因素集合和感染人数;根据各所述影响因素集合和所述感染人数构建与各所述影响因素集合对应的感染人数预测模型;利用所述多个影响因素集合和所述感染人数对各所述感染人数预测模型进行训练,得到非标注数据上方差最小的各所述感染人数预测模型。2.根据权利要求1所述的模型训练方法,其特征在于,获取目标传染病的第一特征数据之前,所述方法还包括:获取所述目标传染病的原始特征数据,所述原始特征数据包括所述目标传染病的多个影响因素和所述感染人数;基于所述多个影响因素和所述感染人数通过启发式搜索方式确定所述多个影响因素集合。3.根据权利要求2所述的模型训练方法,其特征在于,所述多个影响因素集合至少包括第一影响因素集合和第二影响因素集合;所述基于所述多个影响因素和所述感染人数通过启发式搜索方式确定所述多个影响因素集合,包括:构造第一空集和第二空集;轮询各所述影响因素,计算各所述影响因素、所述感染人数、所述第一空集和所述第二空集之间的关联性;确定所述关联性满足预设关联条件的目标影响因素,并根据所述目标影响因素更新所述第一空集和所述第二空集,得到所述第一影响因素集合和所述第二影响因素集合。4.根据权利要求1所述的模型训练方法,其特征在于,所述根据各所述影响因素集合和所述感染人数构建与各所述影响因素集合对应的感染人数预测模型,包括:根据各所述影响因素集合和所述感染人数之间的对应关系得到各所述影响因素集合对应的标注数据和非标注数据;根据各所述影响因素集合对应的所述标注数据确定所述标注数据服从的第一高斯分布;根据各所述影响因素集合对应的所述非标注数据确定所述非标注数据服从的第二高斯分布;对所述第一高斯分布和所述第二高斯分布进行联合分布计算,得到各所述感染人数预测模型。5.根据权利要求4所述的模型训练方法,其特征在于,所述根据各所述影响因素集合对应的所述标注数据确定所述标注数据服从的第一高斯分布,包括:向量化所述标注数据中的各所述影响因素,得到多个影响因素向量;利用预设的网络模型对任意两个所述影响因素向量进行计算,得到所述标注数据对应的协方差矩阵;根据预设的均值向量和所述协方差矩阵确定所述第一高斯分布。6.根据权利要求1所述的模型训练方法,其特征在于,所述利用所述多个影响因素集合
和所述感染人数对各所述感染人数预测模型进行训练,得到非标注数据上方差最小的各所述感染人数预测模型,包括:根据所述多个影响因素集合和所述感染人数之间的对应关系得到所述多个影响因素集合对应的标注数据和非标注数据;获取所述标注数据对应的感染人数分布和所述非标注数据对应的方差;根据所述感染人数分布和所述方差构建目标函数;基于所述目标函数,利用梯度下降算法对各所述感染人数预测模型的模型参数进行迭代更新,当...

【专利技术属性】
技术研发人员:张振中
申请(专利权)人:京东方科技集团股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1