目标疾病的药物组挖掘方法和装置、电子设备、存储介质制造方法及图纸

技术编号:34273200 阅读:16 留言:0更新日期:2022-07-24 16:31
本公开实施例提供目标疾病的药物组挖掘方法和装置、电子设备、存储介质,涉及人工智能技术领域。该目标疾病的药物组挖掘方法,包括:获取目标疾病的目标医疗数据;对药物组数据进行向量转换处理,得到药物组向量;根据处方数据、药物组向量得到目标句向量;根据用药频率数据得到住院时长频率分类数据;根据住院时长频率分类数据得到聚类参数信息,并对目标句向量进行聚类处理,得到聚类结果数据;根据聚类结果数据进行生存分析处理,得到生存曲线信息;根据生存曲线信息从药物组数据进行药物挖掘处理,得到针对目标疾病的目标药物组挖掘结果,通过本公开实施例提供的技术方案可以提升药物挖掘结果的有效性。药物挖掘结果的有效性。药物挖掘结果的有效性。

Drug group mining method and device for target disease, electronic equipment, storage medium

【技术实现步骤摘要】
目标疾病的药物组挖掘方法和装置、电子设备、存储介质


[0001]本专利技术涉及人工智能
,尤其涉及一种目标疾病的药物组挖掘方法和装置、电子设备、存储介质。

技术介绍

[0002]当前针对创伤性脑损伤等疾病进行药物挖掘的方法主要包括以下两类:(1)基于数据模型的数据挖掘方法、(2)基于生存时间和生存状态的生存分析方法。
[0003]其中,当前的药物挖掘的方法(1)仍然停留在药物统计阶段,受文献收录处方影响较大,处方丰富度决定了数据库的完整性,比如,以临床症状为研究主体的药物挖掘方法,仅考虑了症状与药物对应关系和与症状对应的药物的使用频率,考虑的因素较为单一,导致药物挖掘结果的有效性较差;而数据模型存在着限制条件过于严格的缺陷,如要求样本数据服从多元正态分布、协方差矩阵相同等,这导致挖掘算法的运算效率受限;当前的药物挖掘的方法(2)只是考虑到生存时间与生存状态的关系,然后利用生存曲线表现生存概率,导致药物挖掘结果的有效性较差。
[0004]综上所述,当前的药物挖掘的方法存在着运算效率受限、药物挖掘结果的有效性较差的问题。

技术实现思路

[0005]本公开实施例的主要目的在于提出一种目标疾病的药物组挖掘方法和装置、电子设备、存储介质,能够提高药物挖掘算法的运算效率、提升药物挖掘结果的有效性。
[0006]为实现上述目的,本公开实施例的第一方面提出了一种目标疾病的药物组挖掘方法,包括:
[0007]获取目标疾病的目标医疗数据;所述目标医疗数据包括患者的药物组数据、处方数据、健康数据、用药频率数据,其中,所述健康数据包括住院时长数据、出院状态数据,所述药物组数据为包括至少两种药物数据的组合;
[0008]对所述药物组数据进行向量转换处理,得到药物组向量;
[0009]根据所述处方数据、所述药物组向量得到每个患者对应的目标句向量;
[0010]根据所述用药频率数据对所述健康数据进行数据划分处理,得到住院时长频率分类数据;其中,所述住院时长频率分类数据包括高频率数据、低频率数据;
[0011]根据所述住院时长频率分类数据得到聚类参数信息;
[0012]根据所述聚类参数信息对所述目标句向量进行聚类处理,得到聚类结果数据;
[0013]根据所述聚类结果数据对每个所述药物组数据对应的所述住院时长频率分类数据进行生存分析处理,分别得到所述高频率数据和所述低频率数据对应的生存曲线信息;
[0014]根据所述生存曲线信息从所述药物组数据进行药物挖掘处理,得到针对所述目标疾病的目标药物组挖掘结果。
[0015]在一些实施例,所述获取目标疾病的目标医疗数据,包括:
[0016]获取所述目标疾病的原始医疗数据;
[0017]对所述原始医疗数据进行数据预处理,得到所述目标医疗数据;所述数据预处理包括针对同一出院状态病患数据的筛选处理、住院时长训练集划分处理、重复值处理、缺失值处理、异常值处理。
[0018]在一些实施例,所述对所述药物组数据进行向量转换处理,得到药物组向量,包括:
[0019]对所述药物组数据对应的至少两种所述药物数据进行编码处理,得到至少两个药物编码向量;所述药物编码向量至少包括第一药物向量、第二药物向量;
[0020]以所述第一药物向量为输入、并以所述第二药物向量为输出构建得到神经网络模型;
[0021]获取模型训练参数;所述模型训练参数包括数据箱大小、迭代次数、节点数目、向量维度;
[0022]根据所述模型训练参数和预设的损失函数对所述神经网络模型进行训练,以得到所述神经网络模型的权重矩阵;
[0023]根据所述权重矩阵和所述药物编码向量得到所述药物组向量。
[0024]在一些实施例,所述根据所述处方数据、所述药物组向量得到每个患者对应的目标句向量,包括:
[0025]以所述处方数据为段落、并以所述处方数据中的所述药物数据为句子进行平滑倒词频计算,得到每个所述药物组向量的加权系数;
[0026]根据所述加权系数对所述药物组向量进行加权处理,得到每个患者对应的患者句向量;
[0027]对所述患者句向量进行矩阵主成分去除处理,得到每个患者对应的所述目标句向量。
[0028]在一些实施例,所述根据所述住院时长频率分类数据得到聚类参数信息,包括:
[0029]根据所述住院时长频率分类数据得到生存分布差异数据;
[0030]对所述生存分布差异数据进行标准化处理,得到生存分布标准化差异数据;
[0031]根据所述生存分布标准化差异数据确定所述聚类参数信息;所述聚类参数信息包括聚类个数值。
[0032]在一些实施例,所述根据所述聚类结果数据对每个所述药物组数据对应的所述住院时长频率分类数据进行生存分析处理,包括:
[0033]根据所述用药频率数据,对每个所述药物组数据对应的所述聚类结果数据进行频率排序处理,得到频率排序列表;
[0034]根据所述频率排序列表依次对每个所述药物组数据对应的所述住院时长频率分类数据进行所述生存分析处理。
[0035]在一些实施例,所述根据所述生存曲线信息从所述药物组数据进行药物挖掘处理,得到针对所述目标疾病的目标药物组挖掘结果,包括:
[0036]对所述生存曲线信息进行时序检验处理,得到生存分布差异结果;
[0037]若所述生存分布差异结果符合预设的生存分布差异标准,则将所述生存分布差异结果对应的药物组数据作为针对所述目标疾病的所述目标药物组挖掘结果。
[0038]为实现上述目的,本公开的第二方面提出了一种目标疾病的药物组挖掘装置,包括:
[0039]医疗数据获取模块,用于获取目标疾病的目标医疗数据;所述目标医疗数据包括患者的药物组数据、处方数据、健康数据、用药频率数据,其中,所述健康数据包括住院时长数据、出院状态数据,所述药物组数据为包括至少两种药物数据的组合;
[0040]向量转化处理模块,用于对所述药物组数据进行向量转换处理,得到药物组向量;
[0041]句向量生成模块,用于根据所述处方数据、所述药物组向量得到每个患者对应的目标句向量;
[0042]基于用药频率的数据划分模块,用于根据所述用药频率数据对所述健康数据进行数据划分处理,得到住院时长频率分类数据;其中,所述住院时长频率分类数据包括高频率数据、低频率数据;
[0043]聚类参数生成模块,用于根据所述住院时长频率分类数据得到聚类参数信息;
[0044]聚类模块,用于根据所述聚类参数信息对所述目标句向量进行聚类处理,得到聚类结果数据;
[0045]生存分析模块,用于根据所述聚类结果数据对每个所述药物组数据对应的所述住院时长频率分类数据进行生存分析处理,分别得到所述高频率数据和所述低频率数据对应的生存曲线信息;
[0046]目标药物组挖掘模块,用于根据所述生存曲线信息从所述药物组数据进行药物挖掘处理,得到针对所述目标疾病的目标药物本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种目标疾病的药物组挖掘方法,其特征在于,包括:获取目标疾病的目标医疗数据;所述目标医疗数据包括患者的药物组数据、处方数据、健康数据、用药频率数据,其中,所述健康数据包括住院时长数据、出院状态数据,所述药物组数据为包括至少两种药物数据的组合;对所述药物组数据进行向量转换处理,得到药物组向量;根据所述处方数据、所述药物组向量得到每个患者对应的目标句向量;根据所述用药频率数据对所述健康数据进行数据划分处理,得到住院时长频率分类数据;其中,所述住院时长频率分类数据包括高频率数据、低频率数据;根据所述住院时长频率分类数据得到聚类参数信息;根据所述聚类参数信息对所述目标句向量进行聚类处理,得到聚类结果数据;根据所述聚类结果数据对每个所述药物组数据对应的所述住院时长频率分类数据进行生存分析处理,分别得到所述高频率数据和所述低频率数据对应的生存曲线信息;根据所述生存曲线信息从所述药物组数据进行药物挖掘处理,得到针对所述目标疾病的目标药物组挖掘结果。2.根据权利要求1所述的方法,其特征在于,所述获取目标疾病的目标医疗数据,包括:获取所述目标疾病的原始医疗数据;对所述原始医疗数据进行数据预处理,得到所述目标医疗数据;所述数据预处理包括针对同一出院状态病患数据的筛选处理、住院时长训练集划分处理、重复值处理、缺失值处理、异常值处理。3.根据权利要求1所述的方法,其特征在于,所述对所述药物组数据进行向量转换处理,得到药物组向量,包括:对所述药物组数据对应的至少两种所述药物数据进行编码处理,得到至少两个药物编码向量;所述药物编码向量至少包括第一药物向量、第二药物向量;以所述第一药物向量为输入、并以所述第二药物向量为输出构建得到神经网络模型;获取模型训练参数;所述模型训练参数包括数据箱大小、迭代次数、节点数目、向量维度;根据所述模型训练参数和预设的损失函数对所述神经网络模型进行训练,以得到所述神经网络模型的权重矩阵;根据所述权重矩阵和所述药物编码向量得到所述药物组向量。4.根据权利要求1所述的方法,其特征在于,所述根据所述处方数据、所述药物组向量得到每个患者对应的目标句向量,包括:以所述处方数据为段落、并以所述处方数据中的所述药物数据为句子进行平滑倒词频计算,得到每个所述药物组向量的加权系数;根据所述加权系数对所述药物组向量进行加权处理,得到每个患者对应的患者句向量;对所述患者句向量进行矩阵主成分去除处理,得到每个患者对应的所述目标句向量。5.根据权利要求1所述的方法,其特征在于,所述根据所述住院时长频率分类数据得到聚类参数信息,包括:根据所述住院时长频率分类数据得到生存分布差异数据;
对所述生存分布差异...

【专利技术属性】
技术研发人员:张莲民刘正锋张婧霞张功球罗敏
申请(专利权)人:深圳市大数据研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1