【技术实现步骤摘要】
基于数据挖掘技术的心血管疾病患者虚弱症分级方法
本专利技术涉及数据挖掘、机器学习、人工智能等计算机专业领域和医疗数据应用领域,具体为一种辅助确定心血管疾病患者当前所处虚弱状态的方法。
技术介绍
随着医疗行业信息化建设的不断完善,各个业务系统生成大量的患者健康相关的检查和检验数据。基于数据挖掘和人工智能等技术,提取这些数据中隐藏的,而又具有一定潜在价值的信息和知识,可以构建一个大的数据知识库。通过对此知识库进行学习,可以得到一个具有决策能力的“大脑”,用以辅助医生对患者身体状态的把握,从而在进行医疗治疗过程可以选择更佳的临床决策,对医疗质量的提高有促进与推动的作用。在国内,相关的研究最早可追溯到1978年北京中医医院与计算机专家合作开展的“关幼波肝病诊疗程序”项目。这各也是国内首个将医学专家系统与中国传统医学相结合的医疗系统。其它的系统还有,1986年福建中医学院与省计算中心合作开发的“林如高骨伤计算机诊疗系统”;1992年,中国中医研究院和中国科学院共同研发“中国中医治疗专家系统”。现有技术的缺点:方法简单,分类精确度和准确度低,相同虚弱症数目,但不同症状患者的区分度低。
技术实现思路
本专利技术所要解决的技术问题总的来说是提供一种基于数据挖掘技术的心血管疾病患者虚弱症分级方法;面对需住院或手术治疗的突发、重症心血管疾病患者,为了更准确、更迅速的得出具有数据意义的虚弱指数,专利技术一套虚弱症分级方法和算法。通过机器学习技术对门诊数据进行数据挖掘和分析等处理,可以获得更精确的患者虚弱指数,从而辅助医生实现对患者的个性化、精准治疗决策。详细解决的技术问题以及取得有 ...
【技术保护点】
1.一种基于数据挖掘技术的心血管疾病患者虚弱症分级方法,其特征在于:具体步骤如下:步骤一,在平台上建立用于对患者信息进行管理与使用的患者用户档案,用户对应患者一一映射;步骤二,首先,患者的数据信息通过患者或医生填入数据库;然后,平台并生成数据并进行存储到硬盘或内存中;步骤三,首先,用户或医生将患者就诊时自诉的症状信息与医生对患者的诊断信息通过平台登入窗口上报至数据云处理器;然后,数据云处理器对症状信息与诊断信息存储与预处理;其次,将预处理后的信息作为分类模型的训练的数据项;步骤四,首先,将数据项的数据从数据云处理器导入脱敏化模块中;然后,脱敏化模块对数据进行脱敏化处理;步骤五,将脱敏化处理数据导入正则化预处理模块,正则化预处理模块将数据项的文本数据进行数值化;步骤六,建立对照表模块,然后将数值化后的患者数据导入;步骤七,首先,根据平台处理能力和数据量情况,选取分组的模;然后,将对照表模块得到的数据分成若干组,并导入分组模块中;其次,将每组数据导入判定模块中;步骤八,判定模块判定分组模块传入的数据量,进行判定:若该组含有数据的条数等于分组的模,则进行批处理导入主成分分析模块;若数据量小于 ...
【技术特征摘要】
1.一种基于数据挖掘技术的心血管疾病患者虚弱症分级方法,其特征在于:具体步骤如下:步骤一,在平台上建立用于对患者信息进行管理与使用的患者用户档案,用户对应患者一一映射;步骤二,首先,患者的数据信息通过患者或医生填入数据库;然后,平台并生成数据并进行存储到硬盘或内存中;步骤三,首先,用户或医生将患者就诊时自诉的症状信息与医生对患者的诊断信息通过平台登入窗口上报至数据云处理器;然后,数据云处理器对症状信息与诊断信息存储与预处理;其次,将预处理后的信息作为分类模型的训练的数据项;步骤四,首先,将数据项的数据从数据云处理器导入脱敏化模块中;然后,脱敏化模块对数据进行脱敏化处理;步骤五,将脱敏化处理数据导入正则化预处理模块,正则化预处理模块将数据项的文本数据进行数值化;步骤六,建立对照表模块,然后将数值化后的患者数据导入;步骤七,首先,根据平台处理能力和数据量情况,选取分组的模;然后,将对照表模块得到的数据分成若干组,并导入分组模块中;其次,将每组数据导入判定模块中;步骤八,判定模块判定分组模块传入的数据量,进行判定:若该组含有数据的条数等于分组的模,则进行批处理导入主成分分析模块;若数据量小于分组的模,首先,先将此部分数据导入数据模型模块处理一次,得出此患者的虚弱值;然后,将获得的虚弱值随数据模型模块数据一起向下导入,同时将此分组数据存入此判定模块的数据栈中;其次,统计数据栈中的数据量并进行判定:如果统计数据栈中的数据量超过分组的模,则取出时间序列中前分组的模的数据,分成一组,导入主成分分析模块,剩下的数据继续等待合并新的数据集;如果未超过分组的模,则合并后继续等待新的数据;步骤九,主成分分析模块对从步骤八传入的数据进行主成分分析;首先,对数据进行降维因子分析,当对于第一次进行分析时,先对所有数据项进行Person关联分析法,去除相关程度低的数据项,本数据集中最终选取10项数据项作为提取因子,为fl_flag、xm_flag、ty_flag、xj_flag、kg_flag、xlsj_flag、gxy_flag、ng_flag、tnb_flag、ks_flag所表示的数据项,将KMO值提升到0.7以上,达到主成分分析法适用的标准;然后,通过计算得到解释总方差,选取累计表达超过90%的初始特征、提取平方和载入,并获取成分矩阵;其次,将获取的数据与患者数据导入权重模块;步骤十,将主成分分析模块的数据进行求取数据权重值;首先,用得到的矩阵成分E与对应初始特征值t求商Q,即公式(1):然后,将上一结果Q与方差S代入下一公式计算H,即公式(2):即求出主成分的方差贡献度;其次,对整体进行平移,使所有值为正数,获得H’,即公式(3):H'=H+MIN(H)(3)再次,对指标权重进行归一化,得出的结果为数据项fl_flag、xm_flag、ty_flag、xj_flag、kg_flag、xlsj_flag、gxy_flag、ng_flag、tnb_flag、ks_flag的权重值;最后,将患者数据与得出的权重值导入下一模块。步骤十一,对权重模块的值进行权重值的应用,首先,更新目前的权重,对第一次使用时初始值为0.1,直接更新;之后,按每组的权重与目前的权重求均值进行更新;其次,与权重相对应的数据项进行求积的和,获得一个1以内的数值,将其作为不健康度B,即公式(4):表示患者的身体状况,与利用患者年龄生成的数据指标,该指标定为年龄度A;再次,组成一个2维数组,将每个数据表示成一个2维坐标中的点;最后,此数据为最终处理数据,并导入下一模块;步骤十二,首先,将处理后的数据中年龄度A与不健康度B两项,按组输入高斯聚类模块,即公式(5):其中μ是n维均值向量,∑是n*n的协方差矩阵,l为n维样本空间中的随机向量l,α为混合系数,将目标期望值分为三类:早期虚弱,中期虚弱,晚期虚弱,即将混合成分k设定为3,其次,计算每个数据对应各个混合成分的后验概率,即公式(6):根据后验概率生成新的均值向量μ`、新的协方差矩阵∑`、新的混合系数α`,对模型中的均值向量、协方差矩阵和混合系数进行迭代更新,直到收敛为止;再次,对数据进行确定分类的簇标记,即公式(7):γj=argmaxχji,i∈{1,2,...,k}(7)通过极大似然...
【专利技术属性】
技术研发人员:冯云霞,韩正亮,李旭,
申请(专利权)人:青岛科技大学,
类型:发明
国别省市:山东,37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。