System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及医疗领域,具体来说,涉及医疗领域中基于机器学习进行疾病预测的技术,更具体来说,涉及一种疾病预测模型的训练方法、疾病预测系统。
技术介绍
1、医学诊断指的是根据病人的症状和数据来判断病人所患得疾病。这需要具有医学专业知识的医生根据大量的医疗数据来进行诊断,但很多地区都面临着医疗资源短缺的问题,医生的数量远远无法满足人们的需求。随着深度学习技术的发展,人们开始用人工智能来辅助医生进行医学诊断,从而缓解医疗资源不足的问题,让更多的人可以及时得到医疗救助。因此研究基于深度学习的医疗诊断技术具有非常重要的现实意义和广阔的应用前景。
2、在医学诊断中,患者往往需要进行多项不同类型的检查,不同类型检查的结果往往是不同的形式,这导致医疗数据包含不同的形式,具有异质性。现有的研究主要集中在单模态内部的医疗数据,根据对医疗数据处理后获得的特征进行疾病预测模型的训练,并使用该模型进行疾病预测,例如医学影像(即图像数据),病历纪录(即病历数据),脑电信号,心电图等。也有一些工作使用多模态的医疗数据进行诊断,但主要的方法是将各个模态医疗数据的特征按照一定的方式融合在一起,根据最后的融合特征进行疾病预测模型的训练,并使用该模型进行疾病预测。
3、然而医疗数据中存在着大量结构上的关联,比如不同病人之间存在着社会关系,同一病人所进行的各项检查之间存在着结构关联,患有同种疾病的不同病人的同一项检查结果之间也可能存在着关联。这些关联中存在着丰富的信息,所以我们可以根据这些关联去推测一个人是否患有疾病,例如尘肺病人的同事往往也可
4、综上所述,目前亟需一种利用不同模态的医疗数据间的结构关联信息进行疾病预测模型的训练,并使用该模型进行疾病预测,进而更好地去辅助医生进行疾病诊断。
技术实现思路
1、因此,本专利技术的目的在于克服上述现有技术的缺陷,提供一种疾病预测模型的训练方法、疾病预测系统。
2、本专利技术的目的是通过以下技术方案实现的:
3、根据本专利技术的第一方面,提供一种疾病预测模型的训练方法,所述方法包括:
4、s1、获取医疗数据集,其包括多个医疗数据,每个医疗数据对应有一种或多种症状,部分医疗数据对应有一种或多种疾病;
5、s2、将每个医疗数据作为一个医疗数据节点、每种症状作为一个症状节点、每种疾病作为一个疾病节点,基于所述医疗数据集构建异构图,其中,医疗数据节点与其有对应关系的症状节点之间有边,医疗数据节点与其有对应关系的疾病节点之间有边;
6、s3、基于图神经网络构建初始疾病预测模型,并以异构图为输入、每个医疗数据节点与每个疾病节点之间是否有边为输出,采用异构图对所述初始疾病预测模型进行多轮迭代训练直至收敛,其中,在每轮训练过程中,以异构图中医疗数据节点与疾病节点之间有边的节点对集合和医疗数据节点与疾病节点之间没有边的节点对集合的对比损失更新疾病预测模型参数。
7、在本专利技术的一些实施例中,所述初始疾病预测模型包括:
8、特征提取模块,用于提取异构图中医疗数据节点、症状节点和疾病节点的初始特征以及异构图的结构特征矩阵,其中,所述异构图的结构特征矩阵指示异构图中每个节点与其他节点之间的对应关系;
9、自我图模块,用于基于元路径在所述结构特征矩阵中分别查找以每个医疗数据节点为中心医疗数据节点的多个医疗数据节点自我图以及以每个疾病节点为中心疾病节点的多个疾病节点自我图;
10、图神经网络模块,用于对以每个医疗数据节点为中心医疗数据节点的多个医疗数据节点自我图分别进行编码以得到每个医疗数据节点自我图中的中心医疗数据节点的语义特征,以及对以每个疾病节点为中心疾病节点的多个疾病节点自我图分别进行编码以得到每个疾病节点自我图中的中心疾病节点的语义特征;
11、注意力机制模块,用于基于以每个医疗数据节点为中心医疗数据节点的所有医疗数据节点自我图中的中心医疗数据节点的语义特征得到每个医疗数据节点自我图的权重,以及基于以每个疾病节点为中心疾病节点的所有疾病节点自我图中的中心疾病节点的语义特征得到每个疾病节点自我图的权重;
12、加权融合模块,用于基于以每个医疗数据节点为中心医疗数据节点的所有医疗数据节点自我图的权重对其中的中心医疗数据节点的语义特征进行加权融合以得到该中心医疗数据节点的目标语义特征,以及基于以每个疾病节点为中心疾病节点的所有疾病节点自我图的权重对其中的中心疾病节点的语义特征进行加权融合以得到该中心疾病节点的目标语义特征;
13、内积模块,用于基于每个医疗数据节点的目标语义特征和每个疾病节点的目标语义特征计算每个医疗数据节点与每个疾病节点之间有对应关系的概率,并基于每个医疗数据节点与每个疾病节点之间有对应关系的概率按照预设的标准判定二者之间是否有边。
14、在本专利技术的一些实施例中,所述特征提取模块包括:
15、所述第一特征提取器,用于提取异构图中每个医疗数据节点的初始特征;
16、所述第二特征提取器,用于提取异构图中每个疾病节点的初始特征;
17、所述第三特征提取器,用于提取异构图中每个症状节点的初始特征;
18、所述第四特征提取器,用于提取异构图的结构特征矩阵。
19、在本专利技术的一些实施例中,所述自我图模块被配置为用于按照预设的层次基于元路径在所述结构特征矩阵中分别查找以每个医疗数据节点为中心医疗数据节点的多个医疗数据节点自我图以及以每个疾病节点为中心疾病节点的多个疾病节点自我图。
20、在本专利技术的一些实施例中,所述预设的层次至少包括:3层、和/或5层、和/或7层。
21、在本专利技术的一些实施例中,所述图神经网络模块被配置为:
22、采用如下方式对以每个医疗数据节点为中心医疗数据节点的多个医疗数据节点自我图分别进行编码以得到每个医疗数据节点自我图中的中心医疗数据节点的语义特征:
23、
24、其中,表示以第i个医疗数据节点为中心医疗数据节点的医疗数据节点自我图pu中的中心医疗数据节点的语义特征,o为图神经网络中的dropout层,hi表示第i个医疗数据节点的初始特征,σ(·)为图神经网络中的激活函数,c为图神经网络中预设的正则化系数,ni表示以第i个医疗数据节点为中心医疗数据节点的医疗数据节点自我图pu中与该中心医疗数据节点有边的节点总数,表示图神经网络的参数,φ(·)为映射函数,ha表示以第i个医疗数据节点为中心医疗数据节点的医疗数据节点自我图pu中与该中心医疗数据节点有边的第a个节点的初始特征,表示以第i个医疗数据节点为中心医疗数据节点的医疗数据节点自我图pu中与该中心医疗数据节点有边的节点之间预设的关系特征本文档来自技高网...
【技术保护点】
1.一种疾病预测模型的训练方法,所述疾病预测模型用于基于医疗数据进行疾病预测,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述初始疾病预测模型包括:
3.根据权利要求2所述的方法,其特征在于,所述特征提取模块包括:
4.根据权利要求2所述的方法,其特征在于,所述自我图模块被配置为用于按照预设的层次基于元路径在所述结构特征矩阵中分别查找以每个医疗数据节点为中心医疗数据节点的多个医疗数据节点自我图以及以每个疾病节点为中心疾病节点的多个疾病节点自我图。
5.根据权利要求4所述的方法,其特征在于,所述预设的层次至少包括:3层、和/或5层、和/或7层。
6.根据权利要求4所述的方法,其特征在于,所述图神经网络模块被配置为:
7.根据权利要求6所述的方法,其特征在于,所述加权融合模块被配置为:
8.根据权利要求7所述的方法,其特征在于,所述内积模块被配置为采用如下方式计算每个医疗数据节点与每个疾病节点之间对应关系的预测概率:
9.根据权利要求8所述的方法,其特征在于,在所
10.一种疾病预测系统,其特征在于,所述系统包括:
11.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序可被处理器执行以实现权利要求1-9任一所述方法的步骤。
12.一种电子设备,其特征在于,包括:
...【技术特征摘要】
1.一种疾病预测模型的训练方法,所述疾病预测模型用于基于医疗数据进行疾病预测,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述初始疾病预测模型包括:
3.根据权利要求2所述的方法,其特征在于,所述特征提取模块包括:
4.根据权利要求2所述的方法,其特征在于,所述自我图模块被配置为用于按照预设的层次基于元路径在所述结构特征矩阵中分别查找以每个医疗数据节点为中心医疗数据节点的多个医疗数据节点自我图以及以每个疾病节点为中心疾病节点的多个疾病节点自我图。
5.根据权利要求4所述的方法,其特征在于,所述预设的层次至少包括:3层、和/或5层、和/或7层。
6.根据权利要求4所述的方法,其特征在于,所述图神经网...
【专利技术属性】
技术研发人员:蒋鑫龙,陈益强,闫振,张腾,黄武亮,
申请(专利权)人:中国科学院计算技术研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。