医学数据挖掘方法及装置、存储介质、电子设备制造方法及图纸

技术编号:33041793 阅读:14 留言:0更新日期:2022-04-15 09:23
本公开属于医学数据处理领域,涉及一种医学数据挖掘方法及装置、存储介质、电子设备。该方法包括:获取医疗样本数据和医学预测对象;构建医学数据抽取模型,根据医学数据抽取模型提取与医疗预测对象对应的待挖掘医学数据;根据医疗样本数据对待挖掘医学数据进行验证,并确定待挖掘医学数据与医学预测对象之间的关联度,以根据关联度对待挖掘医学数据进行筛选得到目标医学数据;基于医学特征和医学预测对象构建目标预测模型,并根据目标医学数据对目标预测模型中的参数进行调节,以得到调节后的所述目标预测模型。本公开中,在得到待挖掘医学数据之后,通过对待挖掘医学数据进行验证,提高了确定出的目标医学数据的稳定性以及普适性。适性。适性。

【技术实现步骤摘要】
医学数据挖掘方法及装置、存储介质、电子设备


[0001]本公开涉及医学数据处理领域,尤其涉及一种医学数据挖掘方法与医学数据挖掘装置、计算机可读存储介质及电子设备。

技术介绍

[0002]医学知识发现是识别对待预测的医学对象有效的医学数据的过程,通过医学知识发现,可以为医护人员提供一定的辅助决策建议。
[0003]在相关技术中,通常采用机器学习方法发现对待预测医学对象有效的医学数据,然而,使用这种方法识别出的有效医学数据并不一定准确,并且无法对识别出的有效的医学数据进行挖掘和非人工方式的验证,进而无法形成完整的从确定医学数据到验证医学数据的过程,不仅降低了识别出的医学数据的准确度,还降低了识别出的医学数据的普适性以及稳定性。
[0004]鉴于此,本领域亟需开发一种新的医学数据挖掘方法及装置。
[0005]需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现思路

[0006]本公开的目的在于提供一种医学数据挖掘方法、医学数据挖掘装置、计算机可读存储介质及电子设备,进而至少在一定程度上克服由于相关技术导致的无法形成完整从确定医学数据到验证医学数据的过程的问题。
[0007]本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
[0008]根据本专利技术实施例的第一个方面,提供一种医学数据挖掘方法,所述方法包括:获取医疗样本数据和医学预测对象,其中,所述医疗样本数据包括多个医疗特征;构建医学数据抽取模型,根据所述医学数据抽取模型提取与所述医疗预测对象对应的待挖掘医学数据;其中,所述待挖掘医学数据包括待挖掘医学特征、与所述待挖掘医学特征对应的特征值以及所述待挖掘医学特征之间的逻辑关系;根据所述医疗样本数据对所述待挖掘医学数据进行验证,并确定所述待挖掘医学数据与所述医学预测对象之间的关联度,以根据所述关联度对所述待挖掘医学数据进行筛选得到目标医学数据;基于所述医学特征和所述医学预测对象构建目标预测模型,并根据所述目标医学数据对所述目标预测模型中的参数进行调节,以得到调节后的所述目标预测模型。
[0009]在本专利技术的一种示例性实施例中,所述根据所述医疗样本数据对所述待挖掘医学数据进行验证,并确定所述待挖掘医学数据与所述医学预测对象之间的关联度,包括:根据所述医疗样本数据中的医学特征、待挖掘医学数据,对所述医疗样本数据分组,并确定每组的相似度评分值;根据所述相似度评分值,对所述医疗样本数据再分组;根据再分组后每组中所述医疗样本数据的个数,确定所述待挖掘医学数据与所述医学预测对象之间的关联
度。
[0010]在本专利技术的一种示例性实施例中,所述根据医疗样本数据中的医学特征、待挖掘医学数据,对所述医疗样本数据分组,并确定每组的相似度评分值,包括:根据每一所述医疗样本数据是否符合所述待挖掘医学数据,将所述医疗样本数据进行分组,得到第一组和第二组;根据所述医疗样本数据中的所述医学特征以及所述待挖掘医学特征,确定其他医学特征,并根据每一所述医疗样本数据中的所述其他医学特征以及所述医疗样本数据的分组确定相似度评分值。
[0011]在本专利技术的一种示例性实施例中,所述根据所述医疗样本数据中的医学特征以及所述待挖掘医学特征,确定其他医学特征,包括:在所述医疗样本数据中的所述医学特征中剔除所述待挖掘医学特征,以确定其他医学特征。
[0012]在本专利技术的一种示例性实施例中,所述相似度评分值包括高斯核计算结果;所述根据每一所述医疗样本数据中的所述其他医学特征以及所述医疗样本数据的分组确定相似度评分值,包括:确定与所述第一组中所述医疗样本数据对应的第一其他医学特征,并确定与所述第二组中所述医疗样本数据对应的第二其他医学特征;基于高斯核计算公式,确定所述第一其他医学特征和所述第二其他医学特征的相似度评分值。
[0013]在本专利技术的一种示例性实施例中,所述相似度评分值包括第一相似度评分值和第二相似度评分值;所述方法还包括:若所述高斯核计算结果为预设结果,对所述第一其他医学特征进行计算得到所述第一相似度评分值,并对所述第二其他医学特征进行计算得到所述第二相似度评分值。
[0014]在本专利技术的一种示例性实施例中,所述根据所述相似度评分值,对所述医疗样本数据再分组,包括:确定所述第一相似度评分值之间的差值得到第一差值计算结果,并确定所述第二相似度评分值之间差值得到第二差值计算结果;若所述第一差值计算结果小于相似度阈值,确定与所述第一差值计算结果对应的两个所述第一相似度评分值,并将与两个所述第一相似度评分值分别对应的所述第一组中的两个所述医疗样本数据分别归属于病例组和对照组;若所述第二差值计算结果小于所述相似度阈值,确定与所述第二差值计算结果对应的两个所述第二相似度评分值,并将与两个所述第二相似度评分值分别对应的所述第二组中的两个所述医疗样本数据分别归属于所述病例组和所述对照组。
[0015]在本专利技术的一种示例性实施例中,所述根据再分组后每组中所述医疗样本数据的个数,确定所述待挖掘医学数据与所述医学预测对象之间的关联度,包括:获取所述病例组中所述医疗样本数据针对于所述医学预测对象的第一预测标识,并获取所述对照组中所述医疗样本数据针对于所述医学预测对象的第二预测标识;根据所述第一预测标识对所述病例组中的所述医疗样本数据进行再分组,以将所述病例组划分为第一病例分组和第二病例分组;根据所述第二预测标识对所述对照组中的所述医疗样本数据进行再分组,以将所述对照组划分为第一对照分组和第二对照分组;对所述第一病例分组中所述医疗样本数据的个数、所述第二病例分组中所述医疗样本数据的个数、所述第一对照分组中所述医疗样本数据的个数以及所述第二对照分组中所述医疗样本数据的个数进行计算,得到所述待挖掘医学数据与所述医学预测对象之间的关联度。
[0016]在本专利技术的一种示例性实施例中,所述根据所述关联度对所有所述待挖掘医学数据进行筛选得到目标医学数据,包括:确定与所述关联度对应的置信区间,并获取所述置信
区间的置信上限和置信下限;若所述置信上限和所述置信下限均小于预设范围值,或所述置信上限和所述置信下限均大于预设范围值,对所述第一病例分组中所述医疗样本数据的个数、所述第二病例分组中所述医疗样本数据的个数、所述第一对照分组中所述医疗样本数据的个数以及所述第二对照分组中所述医疗样本数据的个数进行计算,得到用于核验所述关联度的核验值;获取核验阈值,并在所述核验值中确定小于所述核验阈值的目标核验值,以确定与所述目标核验值对应的目标关联度;根据所述目标关联度对所有所述待挖掘医学数据进行筛选得到目标医学数据。
[0017]在本专利技术的一种示例性实施例中,所述方法还包括:确定与所述目标核验值对应的目标关联度,若所述目标关联度大于预设关联度,确定所述待挖掘医学数据与所述医学预测对象之间具有正向关联关系;若所述目标关联度小于预设关联度,确定所述待挖掘医学数据与所述医学预测对象之间具有负向关联本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种医学数据挖掘方法,其特征在于,所述方法包括:获取医疗样本数据和医学预测对象,其中,所述医疗样本数据包括多个医疗特征;构建医学数据抽取模型,根据所述医学数据抽取模型提取与所述医疗预测对象对应的待挖掘医学数据;其中,所述待挖掘医学数据包括待挖掘医学特征、与所述待挖掘医学特征对应的特征值以及所述待挖掘医学特征之间的逻辑关系;根据所述医疗样本数据对所述待挖掘医学数据进行验证,并确定所述待挖掘医学数据与所述医学预测对象之间的关联度,以根据所述关联度对所述待挖掘医学数据进行筛选得到目标医学数据;基于所述医学特征和所述医学预测对象构建目标预测模型,并根据所述目标医学数据对所述目标预测模型中的参数进行调节,以得到调节后的所述目标预测模型。2.根据权利要求1所述的医学数据挖掘方法,其特征在于,所述根据所述医疗样本数据对所述待挖掘医学数据进行验证,并确定所述待挖掘医学数据与所述医学预测对象之间的关联度,包括:根据所述医疗样本数据中的医学特征、待挖掘医学数据,对所述医疗样本数据分组,并确定每组的相似度评分值;根据所述相似度评分值,对所述医疗样本数据再分组;根据再分组后每组中所述医疗样本数据的个数,确定所述待挖掘医学数据与所述医学预测对象之间的关联度。3.根据权利要求2所述的医学数据挖掘方法,其特征在于,所述根据医疗样本数据中的医学特征、待挖掘医学数据,对所述医疗样本数据分组,并确定每组的相似度评分值,包括:根据每一所述医疗样本数据是否符合所述待挖掘医学数据,将所述医疗样本数据进行分组,得到第一组和第二组;根据所述医疗样本数据中的所述医学特征以及所述待挖掘医学特征,确定其他医学特征,并根据每一所述医疗样本数据中的所述其他医学特征以及所述医疗样本数据的分组确定相似度评分值。4.根据权利要求3所述的医学数据挖掘方法,其特征在于,所述根据所述医疗样本数据中的医学特征以及所述待挖掘医学特征,确定其他医学特征,包括:在所述医疗样本数据中的所述医学特征中剔除所述待挖掘医学特征,以确定其他医学特征。5.根据权利要求3所述的医学数据挖掘方法,其特征在于,所述根据每一所述医疗样本数据中的所述其他医学特征以及所述医疗样本数据的分组确定相似度评分值,包括:确定与所述第一组中所述医疗样本数据对应的第一其他医学特征,并确定与所述第二组中所述医疗样本数据对应的第二其他医学特征;基于高斯核计算公式,确定所述第一其他医学特征和所述第二其他医学特征的相似度评分值。6.根据权利要求5所述的医学数据挖掘方法,其特征在于,所述相似度评分值包括第一相似度评分值和第二相似度评分值;所述方法还包括:若所述高斯核计算结果为预设结果,对所述第一其他医学特征进行计算得到所述第一
相似度评分值,并对所述第二其他医学特征进行计算得到所述第二相似度评分值。7.根据权利要求6所述的医学数据挖掘方法,其特征在于,所述根据所述相似度评分值,对所述医疗样本数据再分组,包括:确定所述第一相似度评分值之间的差值得到第一差值计算结果,并确定所述第二相似度评分值之间差值得到第二差值计算结果;若所述第一差值计算结果小于相似度阈值,确定与所述第一差值计算结果对应的两个所述第一相似度评分值,并将与两个所述第一相似度评分值分别对应的所述第一组中的两个所述医疗样本数据分别归属于病例组和对照组;若所述第二差值计算结果小于所述相似度阈值,确定与所述第二差值计算结果对应的两个所述第二相似度评分值,并将与两个所述第二相似度评分值分别对应的所述第二组中的两个所述医疗样本数据分别归属于所述病例组和所述对照组。8.根据权利要求7所述的医学数据挖掘方法,其特征在于,所述根据再分组后每组中所述医疗样本数据的个数,确定所述待挖掘医学数据与所述医学预测对象之间的关联度,包括:获取所述病例组中所述医疗样本数据针对于所述医学预测对象的第一预测标识,并获取所述对照组中所述医疗样本数据针对于所述医学预测对象的第二预测标识;根据所述第一预测标识对所述病例组中的所述医疗样本数据进行再分组,以将所述病例组划分为第一病例分组和第二病例分组;根据所述第二预测标识对所述对照组中的所述医疗样本数据进行再分组,以将所述对照组划分为第一对照分组和第二对照分组;对所述第一病例分组中所述医疗样本数据的个数、所述第二病例分组中所述医疗样本数据的个数、所述第一对照分组中所述医疗样本数据的个数以及所述第二对照分组中所述医疗样本数据的个数进行计算,得到所述待挖掘医学数据与所述医...

【专利技术属性】
技术研发人员:杜鑫惠邢航王绍博
申请(专利权)人:医渡云北京技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1