一种基于知识图谱的模型训练方法、装置、设备及介质制造方法及图纸

技术编号:35261597 阅读:15 留言:0更新日期:2022-10-19 10:21
本申请提供了一种基于知识图谱的模型训练方法、装置、设备及介质,方法包括:获取多个患者的病历;对于每一患者,基于该患者的病历中的文字信息,得到该患者对应的至少一个三元组;基于每一患者对应的每一三元组,生成知识图谱,并从知识图谱中抽取出异构图;对于每一患者,将异构图中第一节点以及不同第一节点之间的关系作为第一目标模型、第二目标模型和图神经网络模型的输入,将用于表征该患者对于目标疾病的治疗效果的目标标签作为第一目标模型、第二目标模型和图神经网络模型的输出,对第一目标模型、第二目标模型和图神经网络模型进行训练。本申请能够通过训练后的第一目标模型、第二目标模型和图神经网络模型对患者所患疾病的治疗效果进行评估。疾病的治疗效果进行评估。疾病的治疗效果进行评估。

【技术实现步骤摘要】
一种基于知识图谱的模型训练方法、装置、设备及介质


[0001]本申请涉及数据处理领域,具体而言,涉及一种基于知识图谱的模型训练方法、装置、设备及介质。

技术介绍

[0002]相对其他最常见癌症,肝癌的发病率稍低,而死亡率则偏高,这昭示了肝癌的治疗和预后相对较差。也就是说,肝癌患者急需相对有效的治疗和预后,以延长生存时间和提高生存质量,因此,根据肝癌患者的病历评估肝癌患者对于肝癌的治疗效果是十分必要的。

技术实现思路

[0003]有鉴于此,本申请的目的在于提供一种基于知识图谱的模型训练方法、装置、设备及介质,能够通过训练后的第一目标模型、第二目标模型和图神经网络模型对患者所患疾病的治疗效果进行评估。
[0004]第一方面,本申请实施例提供了一种基于知识图谱的模型训练方法,所述方法包括:
[0005]获取患有目标疾病的多个第一患者各自的病历;
[0006]对于每一所述第一患者,基于该第一患者的病历中包括的文字信息,得到该第一患者对应的至少一个第一三元组,其中,该第一患者对应的第一三元组用于表征该第一患者对于所述目标疾病的诊疗状况;
[0007]基于每一所述第一患者对应的每一所述第一三元组,生成所述目标疾病的知识图谱,并从所述知识图谱中抽取出异构图;
[0008]对于每一所述第一患者,将所述异构图中第一节点以及不同所述第一节点之间的关系作为第一目标模型、第二目标模型和图神经网络模型的输入,将用于表征该第一患者对于所述目标疾病的治疗效果的目标标签作为所述第一目标模型、所述第二目标模型和所述图神经网络模型的输出,对所述第一目标模型、所述第二目标模型和所述图神经网络模型进行训练,得到训练完成后的第一目标模型、训练完成后的第二目标模型和训练完成后的图神经网络模型,其中,所述第一节点为所述异构图中由该第一患者对应的第一三元组所形成的节点,所述目标标签的类别包括n个,n为大于 1的整数,所述第一目标模型依次包括:Bert预训练模型和第一分类器,所述第二目标模型依次包括:所述Bert预训练模型和第二分类器。
[0009]在一种可能的实施方式中,在对于每一所述第一患者,将所述异构图中第一节点以及不同所述第一节点之间的关系作为第一目标模型、第二目标模型和图神经网络模型的输入,将用于表征该第一患者对于所述目标疾病的治疗效果的目标标签作为所述第一目标模型、所述第二目标模型和所述图神经网络模型的输出,对所述第一目标模型、所述第二目标模型和所述图神经网络模型进行训练,得到训练完成后的第一目标模型、训练完成后的第二目标模型和训练完成后的图神经网络模型之后,所述方法还包括:
[0010]获取患有所述目标疾病的第二患者的病历;
[0011]基于所述第二患者的病历中包括的文字信息,得到所述第二患者对应的至少一个第二三元组,其中,所述第二患者对应的第二三元组用于表征所述第二患者对于所述目标疾病的诊疗状况;
[0012]基于所述第二三元组,对所述异构图进行更新,得到更新后的异构图;
[0013]将所述更新后的异构图中所述第二三元组对应的第二节点以及不同所述第二节点之间的关系分别输入到所述训练完成后的第一目标模型、所述训练完成后的第二目标模型和所述训练完成后的图神经网络模型中,得到所述训练完成后的第一目标模型所输出的每一所述目标标签的类别的第一概率、所述训练完成后的第二目标模型所输出的每一所述目标标签的类别的第二概率和所述训练完成后的图神经网络模型所输出的每一所述目标标签的类别的第三概率;
[0014]根据每一所述目标标签的类别的第一概率、每一所述目标标签的类别的第二概率和每一所述目标标签的类别的第三概率,确定所述第二患者对应的所述目标标签的目标类别。
[0015]在一种可能的实施方式中,根据每一所述目标标签的类别的第一概率、每一所述目标标签的类别的第二概率和每一所述目标标签的类别的第三概率,确定所述第二患者对应的所述目标标签的目标类别,包括:
[0016]选取出第一概率最大的目标标签的第一类别,以及,选取出第二概率最大的目标标签的第二类别,以及,选取出第三概率最大的目标标签的第三类别;
[0017]若所述第一类别、所述第二类别和所述第三类别中存在至少两者相同,则所述目标类别为与所述第一类别、所述第二类别和所述第三类别中的至少两者相同的类别;
[0018]若所述第一类别、所述第二类别和所述第三类别均不相同,则将所述第一类别、所述第二类别和所述第三类别中的任一者确定为所述目标类别。
[0019]在一种可能的实施方式中,根据每一所述目标标签的类别的第一概率、每一所述目标标签的类别的第二概率和每一所述目标标签的类别的第三概率,确定所述第二患者对应的所述目标标签的目标类别,还包括:
[0020]对于每一所述目标标签的类别,将该目标标签的类别的第一概率、该目标标签的类别的第二概率和该目标标签的类别的第三概率进行算数平均,得到该目标标签的类别的综合平均概率;
[0021]将综合平均概率最大的目标标签的类别确定为所述目标类别。
[0022]第二方面,本申请实施例还提供了一种基于知识图谱的模型训练装置,所述装置包括:
[0023]第一获取模块,用于获取患有目标疾病的多个第一患者各自的病历;
[0024]第一构建模块,用于对于每一所述第一患者,基于该第一患者的病历中包括的文字信息,得到该第一患者对应的至少一个第一三元组,其中,该第一患者对应的第一三元组用于表征该第一患者对于所述目标疾病的诊疗状况;
[0025]抽取模块,用于基于每一所述第一患者对应的每一所述第一三元组,生成所述目标疾病的知识图谱,并从所述知识图谱中抽取出异构图;
[0026]训练模块,用于对于每一所述第一患者,将所述异构图中第一节点以及不同所述
第一节点之间的关系作为第一目标模型、第二目标模型和图神经网络模型的输入,将用于表征该第一患者对于所述目标疾病的治疗效果的目标标签作为所述第一目标模型、所述第二目标模型和所述图神经网络模型的输出,对所述第一目标模型、所述第二目标模型和所述图神经网络模型进行训练,得到训练完成后的第一目标模型、训练完成后的第二目标模型和训练完成后的图神经网络模型,其中,所述第一节点为所述异构图中由该第一患者对应的第一三元组所形成的节点,所述目标标签的类别包括n个,n为大于1的整数,所述第一目标模型依次包括:Bert预训练模型和第一分类器,所述第二目标模型依次包括:所述Bert预训练模型和第二分类器。
[0027]在一种可能的实施方式中,所述装置还包括:
[0028]第二获取模块,用于在所述训练模块对于每一所述第一患者,将所述异构图中第一节点以及不同所述第一节点之间的关系作为第一目标模型、第二目标模型和图神经网络模型的输入,将用于表征该第一患者对于所述目标疾病的治疗效果的目标标签作为所述第一目标模型、所述第二目标模型和所述图神经网络模型的输出,对所述第一目标模型、所述第二目标模型和所述图神经网络模型进行训练本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于知识图谱的模型训练方法,其特征在于,所述方法包括:获取患有目标疾病的多个第一患者各自的病历;对于每一所述第一患者,基于该第一患者的病历中包括的文字信息,得到该第一患者对应的至少一个第一三元组,其中,该第一患者对应的第一三元组用于表征该第一患者对于所述目标疾病的诊疗状况;基于每一所述第一患者对应的每一所述第一三元组,生成所述目标疾病的知识图谱,并从所述知识图谱中抽取出异构图;对于每一所述第一患者,将所述异构图中第一节点以及不同所述第一节点之间的关系作为第一目标模型、第二目标模型和图神经网络模型的输入,将用于表征该第一患者对于所述目标疾病的治疗效果的目标标签作为所述第一目标模型、所述第二目标模型和所述图神经网络模型的输出,对所述第一目标模型、所述第二目标模型和所述图神经网络模型进行训练,得到训练完成后的第一目标模型、训练完成后的第二目标模型和训练完成后的图神经网络模型,其中,所述第一节点为所述异构图中由该第一患者对应的第一三元组所形成的节点,所述目标标签的类别包括n个,n为大于1的整数,所述第一目标模型依次包括:Bert预训练模型和第一分类器,所述第二目标模型依次包括:所述Bert预训练模型和第二分类器。2.根据权利要求1所述的基于知识图谱的模型训练方法,其特征在于,在对于每一所述第一患者,将所述异构图中第一节点以及不同所述第一节点之间的关系作为第一目标模型、第二目标模型和图神经网络模型的输入,将用于表征该第一患者对于所述目标疾病的治疗效果的目标标签作为所述第一目标模型、所述第二目标模型和所述图神经网络模型的输出,对所述第一目标模型、所述第二目标模型和所述图神经网络模型进行训练,得到训练完成后的第一目标模型、训练完成后的第二目标模型和训练完成后的图神经网络模型之后,所述方法还包括:获取患有所述目标疾病的第二患者的病历;基于所述第二患者的病历中包括的文字信息,得到所述第二患者对应的至少一个第二三元组,其中,所述第二患者对应的第二三元组用于表征所述第二患者对于所述目标疾病的诊疗状况;基于所述第二三元组,对所述异构图进行更新,得到更新后的异构图;将所述更新后的异构图中所述第二三元组对应的第二节点以及不同所述第二节点之间的关系分别输入到所述训练完成后的第一目标模型、所述训练完成后的第二目标模型和所述训练完成后的图神经网络模型中,得到所述训练完成后的第一目标模型所输出的每一所述目标标签的类别的第一概率、所述训练完成后的第二目标模型所输出的每一所述目标标签的类别的第二概率和所述训练完成后的图神经网络模型所输出的每一所述目标标签的类别的第三概率;根据每一所述目标标签的类别的第一概率、每一所述目标标签的类别的第二概率和每一所述目标标签的类别的第三概率,确定所述第二患者对应的所述目标标签的目标类别。3.根据权利要求2所述的基于知识图谱的模型训练方法,其特征在于,根据每一所述目标标签的类别的第一概率、每一所述目标标签的类别的第二概率和每一所述目标标签的类别的第三概率,确定所述第二患者对应的所述目标标签的目标类别,包括:
选取出第一概率最大的目标标签的第一类别,以及,选取出第二概率最大的目标标签的第二类别,以及,选取出第三概率最大的目标标签的第三类别;若所述第一类别、所述第二类别和所述第三类别中存在至少两者相同,则所述目标类别为与所述第一类别、所述第二类别和所述第三类别中的至少两者相同的类别;若所述第一类别、所述第二类别和所述第三类别均不相同,则将所述第一类别、所述第二类别和所述第三类别中的任一者确定为所述目标类别。4.根据权利要求2所述的基于知识图谱的模型训练方法,其特征在于,根据每一所述目标标签的类别的第一概率、每一所述目标标签的类别的第二概率和每一所述目标标签的类别的第三概率,确定所述第二患者对应的所述目标标签的目标类别,还包括:对于每一所述目标标签的类别,将该目标标签的类别的第一概率、该目标标签的类别的第二概率和该目标标签的类别的第三概率进行算数平均,得到该目标标签的类别的综合平均概率;将综合平均概率最大的目标标签的类别确定为所述目标类别。5.一种基于知识图谱的模型训练装置,其特征在于,所述装置包括:第一获取模块,用于获取患有目标疾病的多个第一患者各自的病历;第一构建模块,用于对于每一所述第一患者,基于该第一...

【专利技术属性】
技术研发人员:王瑞国张林许娟史文钊
申请(专利权)人:神州医疗科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1