基于临床数据的特征选择方法及装置制造方法及图纸

技术编号:29972129 阅读:61 留言:0更新日期:2021-09-08 09:50
本发明专利技术公开了一种基于临床数据的特征选择方法及装置,属于数字医疗技术领域。本发明专利技术利用滤波方法和mRMR因子对遗传算法的适应度函数进行了改进,提出了一种基于mRMR

【技术实现步骤摘要】
基于临床数据的特征选择方法及装置


[0001]本专利技术属于数字医疗
,具体涉及一种基于临床数据的特征选择方法及装置。

技术介绍

[0002]随着数字化浪潮的兴起,对实体经济进行数字化成为了一个脍炙人口的话题,而数字化中最重要的资产便是其中的数据。当前进行辅助治疗的医疗器械的蓬勃发展,进一步带动了医疗数据成多元化、规模化等特点发展,而利用这些庞大的数据去挖掘出有用的信息辅助医疗诊断成为一个有意义的话题。基于医疗数据去对疾病预测、远程治疗等可以更有效的使医疗数据系统更有效的进行运作。
[0003]医学数据爆炸式地产生,通过计算机技术进行自动化的分析和预测是有用且高效的。它包括通过一些机器学习算法(如神经网络、随机森林、支持向量机SVM)一些算法对医疗数据进行预测,即基于现有的机器学习算法构建预测目标的预测模型,并且医学数据的多元化而呈现为数据特征的高纬度特性,为了保证预测任务的准确性,往往通过特征选择等方式来对高维医疗数据特征进行降维,选取更有效的特征进行预测任务,例如呼吸类疾病的预测,基于对应预测目标的训练数据集完成对所设定的预测本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.基于临床数据的特征选择方法,其特征在于,所述方法包括:采集临床医疗数据,设置预测目标的目标类别;根据高斯核密度函数估计每项数据之间的互信息值,并基于每项数据的互信息值计算mRMR因子;以每个数据项的mRMR因子作为个体分数,根据遗传选择算法从所述临床医疗数据的所有数据项中选择出当前预测目标的第一特征子集,得到该临床医疗数据的第一特征选择结果。2.如权利要求1所述的方法,其特征在于,还包括对所获得的第一特征子集进行第二选择处理,获得第二特征子集,所述第二选择处理包括:步骤b1,基于随机森林作为预测目标的预测模型,以采集的临床医疗数据中对应第一特征子集的数据作为样本,得到预测模型的样本集;步骤b2,初始化特征集合S0为空集,剩余特征集合S1为当前得到的预测目标的特征子集;以及设置关于样本袋外误差的特征重要度评估函数,和预测性能评估函数;步骤b3,基于预测模型和特征重要度评估函数获取第一特征子集中各个特征的重要度,并按照重要降序排列得到第一特征序列的初始值;步骤b4,从剩余特征集合S1中选择第一特征序列中最靠前一个特征xi加入集合S0,并从剩余特征集合S1中去掉特征xi,以及从第一特征序列中删除特征xi;根据预测性能评估函数,通过所述预测模型对特征集合S0进行评估,得到加入特征xi后的预测性能,若比加入之前的预测性能更好,则保留特征xi,否则,从特征集合S0中删除特征xi,其中,集合S0所对应的预测性能的初始值为预测性能的最小取值,例如设置为0;重复步骤b4,直到遍历完第一特征序列中的所有特征值,基于当前特征集合S0得到第二特征子集。3.如权利要求2所述的方法,其特征在于,所述预测模型和特征重要度评估函数为:其中VI
j

【专利技术属性】
技术研发人员:罗嘉庆郭春来陈子蝶
申请(专利权)人:电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1