医疗数据分类方法、装置、设备及存储介质制造方法及图纸

技术编号:31023390 阅读:15 留言:0更新日期:2021-11-30 03:19
本申请涉及人工智能与智慧医疗领域,公开了一种医疗数据分类方法、装置、设备及存储介质,用于提高医疗数据分类的准确度。该医疗数据分类方法包括:根据预设的数据维度提取目标病历集的病历数据;基于病历数据构建各目标病历对应的病历矩阵,并将病历矩阵依次输入至预设的多分类神经网络模型;读取多分类神经网络模型输出的各病历矩阵对应的病情分类结果;通过预设的随机算法在各病情分类结果中随机挑选预设数量的病情分类结果作为聚类核;以聚类核为初始聚类中心,对各病历矩阵对应的病情分类结果进行聚类运算,生成病历数据对应的聚类数据。数据。数据。

【技术实现步骤摘要】
医疗数据分类方法、装置、设备及存储介质


[0001]本专利技术涉及人工智能与智慧医疗领域,尤其是一种医疗数据分类方法、装置、设备及存储介质。

技术介绍

[0002]治疗有效性,是指某种治疗方式(例如通过某种药物治疗,或者某种医疗器械治疗)对于疾病的治疗效果的有效性。
[0003]在治疗有效性研究中,通常会评估某种治疗方式对于疾病的治疗效果如何。但有些因素会同时与所研究的疾病和治疗方式有较强的相关关系,因此,在治疗有效性研究中会歪曲治疗方式和疾病的真正关系,干扰治疗效果的评估。这类因素被称为混杂因子(比如,有的治疗方式真实的治疗效果很好,但通常被用于病情较重的病人,所以观察到的病人预后情况是较差的。病情严重程度就是一种混杂因子)。
[0004]为了校正混杂因子的影响,目前的传统方法是使用医疗数据分类方法。即通过逻辑回归模型计算倾向评分,在实验组和对照组中匹配样本,构成新的分布较为均衡的研究人群,以消除混杂因子的影响。但现有方法只能校正少数混杂因子。当混杂因子数量较多时,现有的医疗数据分类方法的准确度较低。

技术实现思路

[0005]本专利技术提供一种医疗数据分类方法、装置、设备及存储介质,用于提高医疗数据分类的准确度。
[0006]为解决上述技术问题,本专利技术提供一种医疗数据分类方法,包括:根据预设的数据维度提取目标病历集的病历数据,其中,目标病历集包括多个目标病历;基于病历数据构建各目标病历对应的病历矩阵,并将病历矩阵依次输入至预设的多分类神经网络模型,其中,多分类神经网络模型的神经网络层包含多个隐含层;每个隐含层用于对病历数据进行非线性拟合;读取多分类神经网络模型输出的各病历矩阵对应的病情分类结果;通过预设的随机算法在各病情分类结果中随机挑选预设数量的病情分类结果作为聚类核;以聚类核为初始聚类中心,对各病历矩阵对应的病情分类结果进行聚类运算,生成病历数据对应的聚类数据。
[0007]可选的,多分类神经网络模型还包括输入层和softmax输出层;输入层用于输入病历矩阵;softmax输出层用于输出病情分类结果;多个隐含层的第一个隐含层的维度与输入层的维度相同,均与病历矩阵的行数对应;softmax输出层的维度与病历矩阵的列数对应。
[0008]可选的,该医疗数据分类方法还包括:获取用于训练多分类神经网络模型的训练数据;训练数据为与病历数据的数据类型相同的大数据;对训练数据进行特征工程处理,以得到特征数据;特征数据为与病历矩阵的行数和列数相同的矩阵数据;基于多分类神经网络算法,对特征数据进行模型训练,以得到多分类神经网络模型;模型训练的优化目标满足
下述公式:其中,A为模型训练的优化目标,w和b为多分类神经网络算法中,未进行模型训练时的固定常数,p为特征数据的列数,n为特征数据的行数,x为特征数据中每一列上的数据,y为特征数据中每一行上的数据
[0009]可选的,病情分类结果满足下述公式:其中,B为病情分类结果,和为多分类神经网络算法中,进行模型训练后的固定常数;x为病历矩阵中每一列上的数据,p为病历矩阵的列数。
[0010]可选的,通过预设的随机算法在各病情分类结果中随机挑选预设数量的病情分类结果作为聚类核,包括:若预设数量的病情分类结果中的至少一个病情分类结果不满足随机算法的输出条件,则调整随机算法中的算法参数,直到预设数量的病情分类结果中的每个病情分类结果均满足随机算法的输出条件。
[0011]可选的,以聚类核为初始聚类中心,对各病历矩阵对应的病情分类结果进行聚类运算,生成病历数据对应的聚类数据,包括:将各病历矩阵对应的病情分类结果分别分为多个数据块;将多个数据块中的每个数据块分别用最大最小距离法优化K

means聚类算法进行Map运算,生成病历数据对应的聚类数据。
[0012]可选的,该医疗数据分类方法还包括:当病历数据对应的聚类数据满足预设的报警条件时,输出报警信息,以提示用户查看病历数据对应的聚类数据。
[0013]为解决上述技术问题,本专利技术实施例还提供一种医疗数据分类装置,包括:处理模块,用于根据预设的数据维度提取目标病历集的病历数据,其中,目标病历集包括多个目标病历;处理模块,还用于基于病历数据构建各目标病历对应的病历矩阵,并将病历矩阵依次输入至预设的多分类神经网络模型,其中,多分类神经网络模型的神经网络层包含多个隐含层;每个隐含层用于对病历数据进行非线性拟合;处理模块,还用于读取多分类神经网络模型输出的各病历矩阵对应的病情分类结果;处理模块,还用于通过预设的随机算法在各病情分类结果中随机挑选预设数量的病情分类结果作为聚类核;生成模块,用于以聚类核为初始聚类中心,对各病历矩阵对应的病情分类结果进行聚类运算,生成病历数据对应的聚类数据。
[0014]可选的,多分类神经网络模型还包括输入层和softmax输出层;输入层用于输入病历矩阵;softmax输出层用于输出病情分类结果;多个隐含层的第一个隐含层的维度与输入层的维度相同,均与病历矩阵的行数对应;softmax输出层的维度与病历矩阵的列数对应。
[0015]可选的,该医疗数据分类装置还包括:获取模块;获取模块,用于获取用于训练多分类神经网络模型的训练数据;训练数据为与病历数据的数据类型相同的大数据;处理模块,还用于对训练数据进行特征工程处理,以得到特征数据;特征数据为与病历矩阵的行数和列数相同的矩阵数据;处理模块,还用于基于多分类神经网络算法,对特征数据进行模型训练,以得到多分类神经网络模型;模型训练的优化目标满足下述公式:其中,A为模型训练的优化目标,w和b为多分类神经网络算法中,未进行模型训练时的固定常数,p为特征数据的列数,n为特征数据的行数,x
为特征数据中每一列上的数据,y为特征数据中每一行上的数据。
[0016]可选的,病情分类结果满足下述公式:其中,B为病情分类结果,和为多分类神经网络算法中,进行模型训练后的固定常数;x为病历矩阵中每一列上的数据,p为病历矩阵的列数。
[0017]可选的,处理模块,具体用于:若预设数量的病情分类结果中的至少一个病情分类结果不满足随机算法的输出条件,则调整随机算法中的算法参数,直到预设数量的病情分类结果中的每个病情分类结果均满足随机算法的输出条件。
[0018]可选的,处理模块,具体用于:将各病历矩阵对应的病情分类结果分别分为多个数据块;将多个数据块中的每个数据块分别用最大最小距离法优化K

means聚类算法进行Map运算,生成病历数据对应的聚类数据。
[0019]可选的,该医疗数据分类装置还包括:输出模块;输出模块,用于当病历数据对应的聚类数据满足预设的报警条件时,输出报警信息,以提示用户查看病历数据对应的聚类数据。
[0020]为解决上述技术问题本专利技术实施例还提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行上述所述医疗数据分类方法的步骤。
[0021]为本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种医疗数据分类方法,其特征在于,包括:根据预设的数据维度提取目标病历集的病历数据,其中,所述目标病历集包括多个目标病历;基于所述病历数据构建各目标病历对应的病历矩阵,并将所述病历矩阵依次输入至预设的多分类神经网络模型,其中,所述多分类神经网络模型的神经网络层包含多个隐含层;每个隐含层用于对所述病历数据进行非线性拟合;读取所述多分类神经网络模型输出的所述各病历矩阵对应的病情分类结果;通过预设的随机算法在所述各病情分类结果中随机挑选预设数量的病情分类结果作为聚类核;以所述聚类核为初始聚类中心,对所述各病历矩阵对应的病情分类结果进行聚类运算,生成所述病历数据对应的聚类数据。2.根据权利要求1所述的医疗数据分类方法,其特征在于,所述多分类神经网络模型还包括输入层和softmax输出层;所述输入层用于输入所述病历矩阵;所述softmax输出层用于输出病情分类结果;所述多个隐含层的第一个隐含层的维度与所述输入层的维度相同,均与所述病历矩阵的行数对应;所述softmax输出层的维度与所述病历矩阵的列数对应。3.根据权利要求1所述的医疗数据分类方法,其特征在于,还包括:获取用于训练所述多分类神经网络模型的训练数据;所述训练数据为与所述病历数据的数据类型相同的大数据;对所述训练数据进行特征工程处理,以得到特征数据;所述特征数据为与所述病历矩阵的行数和列数相同的矩阵数据;基于所述多分类神经网络算法,对所述特征数据进行模型训练,以得到所述多分类神经网络模型;所述模型训练的优化目标满足下述公式:其中,A为所述模型训练的优化目标,w和b为所述多分类神经网络算法中,未进行模型训练时的固定常数,p为所述特征数据的列数,n为所述特征数据的行数,x为所述特征数据中每一列上的数据,y为所述特征数据中每一行上的数据。4.根据权利要求1所述的医疗数据分类方法,其特征在于,所述病情分类结果满足下述公式:其中,B为所述病情分类结果,和为所述多分类神经网络算法中,进行模型训练后的固定常数;x为所述病历矩阵中每一列上的数据,p为所述病历矩阵的列数。5.根据权利要求1所述的医疗数据分类方法,其特征在于,所述通过预设的随机算法在各病情分类结果中随机挑选预设数量的病情分类结...

【专利技术属性】
技术研发人员:陈天歌谢国彤李响
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1