【技术实现步骤摘要】
目标疾病的药物组挖掘方法和装置、电子设备、存储介质
[0001]本专利技术涉及人工智能
,尤其涉及一种目标疾病的药物组挖掘方法和装置、电子设备、存储介质。
技术介绍
[0002]当前针对创伤性脑损伤等疾病进行药物挖掘的方法主要包括以下两类:(1)基于数据模型的数据挖掘方法、(2)基于生存时间和生存状态的生存分析方法。
[0003]其中,当前的药物挖掘的方法(1)仍然停留在药物统计阶段,受文献收录处方影响较大,处方丰富度决定了数据库的完整性,比如,以临床症状为研究主体的药物挖掘方法,仅考虑了症状与药物对应关系和与症状对应的药物的使用频率,考虑的因素较为单一,导致药物挖掘结果的有效性较差;而数据模型存在着限制条件过于严格的缺陷,如要求样本数据服从多元正态分布、协方差矩阵相同等,这导致挖掘算法的运算效率受限;当前的药物挖掘的方法(2)只是考虑到生存时间与生存状态的关系,然后利用生存曲线表现生存概率,导致药物挖掘结果的有效性较差。
[0004]综上所述,当前的药物挖掘的方法存在着运算效率受限、药物挖掘结果的有效
【技术保护点】
【技术特征摘要】
1.一种目标疾病的药物组挖掘方法,其特征在于,包括:获取目标疾病的目标医疗数据;所述目标医疗数据包括患者的药物组数据、处方数据、健康数据、用药频率数据,其中,所述健康数据包括住院时长数据、出院状态数据,所述药物组数据为包括至少两种药物数据的组合;对所述药物组数据进行向量转换处理,得到药物组向量;根据所述处方数据、所述药物组向量得到每个患者对应的目标句向量;根据所述用药频率数据对所述健康数据进行数据划分处理,得到住院时长频率分类数据;其中,所述住院时长频率分类数据包括高频率数据、低频率数据;根据所述住院时长频率分类数据得到聚类参数信息;根据所述聚类参数信息对所述目标句向量进行聚类处理,得到聚类结果数据;根据所述聚类结果数据对每个所述药物组数据对应的所述住院时长频率分类数据进行生存分析处理,分别得到所述高频率数据和所述低频率数据对应的生存曲线信息;根据所述生存曲线信息从所述药物组数据进行药物挖掘处理,得到针对所述目标疾病的目标药物组挖掘结果。2.根据权利要求1所述的方法,其特征在于,所述获取目标疾病的目标医疗数据,包括:获取所述目标疾病的原始医疗数据;对所述原始医疗数据进行数据预处理,得到所述目标医疗数据;所述数据预处理包括针对同一出院状态病患数据的筛选处理、住院时长训练集划分处理、重复值处理、缺失值处理、异常值处理。3.根据权利要求1所述的方法,其特征在于,所述对所述药物组数据进行向量转换处理,得到药物组向量,包括:对所述药物组数据对应的至少两种所述药物数据进行编码处理,得到至少两个药物编码向量;所述药物编码向量至少包括第一药物向量、第二药物向量;以所述第一药物向量为输入、并以所述第二药物向量为输出构建得到神经网络模型;获取模型训练参数;所述模型训练参数包括数据箱大小、迭代次数、节点数目、向量维度;根据所述模型训练参数和预设的损失函数对所述神经网络模型进行训练,以得到所述神经网络模型的权重矩阵;根据所述权重矩阵和所述药物编码向量得到所述药物组向量。4.根据权利要求1所述的方法,其特征在于,所述根据所述处方数据、所述药物组向量得到每个患者对应的目标句向量,包括:以所述处方数据为段落、并以所述处方数据中的所述药物数据为句子进行平滑倒词频计算,得到每个所述药物组向量的加权系数;根据所述加权系数对所述药物组向量进行加权处理,得到每个患者对应的患者句向量;对所述患者句向量进行矩阵主成分去除处理,得到每个患者对应的所述目标句向量。5.根据权利要求1所述的方法,其特征在于,所述根据所述住院时长频率分类数据得到聚类参数信息,包括:根据所述住院时长频率分类数据得到生存分布差异数据;
对所述生存分布差异...
【专利技术属性】
技术研发人员:张莲民,刘正锋,张婧霞,张功球,罗敏,
申请(专利权)人:深圳市大数据研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。