【技术实现步骤摘要】
特征筛选方法、装置、存储介质及电子设备
[0001]本公开涉及数据处理领域,具体地,涉及一种特征筛选方法、装置、存储介质及电子设备。
技术介绍
[0002]特征筛选是机器学习领域中一个重要的数据预处理过程,特征筛选的目的是在数据维度较大的情况下,从众多维度的特征数据中筛选出对模型识别结果影响较大的特征数据,尤其是在银屑病诊断的相关研究中,发现银屑病患者的病变特征较多,例如关节病变,肌腱病变,滑囊病变,其中在关节病变特征中又包括骶髂关节积液状况特征,骶髂关节血流状况特征,骶髂关节骨赘状况特征,髋关节积液状况特征、髋关节腕血流状况特征,髋关节骨赘状况特征,腕关节积液状况特征,腕关节血流状况特征,腕关节骨赘状况特征,肘关节积液状况特征,肘关节血流状况特征,肘关节血流状况特征等等,另外在肌腱病变与滑囊病变中,也会包括积液、血流、骨赘等状况特征,这就导致整个银屑病诊断过程涉及到的待诊断特征数量庞大,如此庞大的待诊断特征数据显然不利于医疗科研人员针对该银屑病的诊断,也不利于相关人体状态判断模型的训练,因此需要从众多的待诊断特征中筛选出相对重要的特征。
[0003]然而,目前的特征筛选方法通常要么存在特征筛选过程所需的计算量较大,特征筛选效率较低的问题,要么存在筛选结果可靠性较差,容易漏掉重要特征的问题。
技术实现思路
[0004]本公开的目的是提供一种特征筛选方法、装置、存储介质及电子设备。
[0005]为了实现上述目的,本公开第一方面提供一种特征筛选方法,所述方法包括:
[0006]获取 ...
【技术保护点】
【技术特征摘要】
1.一种特征筛选方法,其特征在于,所述方法包括:获取多个目标诊断对象中每个所述目标诊断对象的指定特征数据,所述指定特征数据包括多种状况特征,以及所述目标诊断对象对应的类别标注数据,所述类别标注数据用于标注所述目标诊断对象为目标病例对象或者非目标病例对象;根据所述多个目标诊断对象的所述指定特征数据,确定每种所述状况特征对应的第一特征权重和第二特征权重;根据每种所述状况特征对应的所述第一特征权重和所述第二特征权重确定所述状况特征的目标特征权重,所述目标特征权重用于表征所述状况特征对于确定所述目标诊断对象为所述目标病例对象或者所述非目标病例对象的重要程度;根据每种所述状况特征对应的所述目标特征权重从多种所述状况特征中确定所述目标状况特征。2.根据权利要求1所述的方法,其特征在于,根据所述多个目标诊断对象的所述指定特征数据,确定每种所述状况特征对应的第一特征权重,包括:获取多个所述目标诊断对象中指定目标诊断对象与多个所述目标诊断对象中除所述指定目标诊断对象之外的其他目标诊断对象之间的欧式距离;将所述指定目标诊断对象与所述其他目标诊断对象中所述欧式距离小于第一预设距离阈值的目标诊断对象作为所述指定目标诊断对象对应的第一目标诊断对象集合中的元素;在确定所述第一目标诊断对象集合中包括多个目标病例对象和多个非目标病例的情况下,将所述第一目标诊断对象集合对应的所述指定目标诊断对象作为待定目标诊断对象,以得到由多个所述待定目标诊断对象组成的第二目标诊断对象集合;获取所述第一目标诊断对象集合中每个所述待定目标诊断对象对应的目标同类对象和目标非同类对象;获取每个所述待定目标诊断对象的每种所述状况特征与该待定目标诊断对象对应的目标同类对象的该状况特征的第一平均距离,以及每个所述待定目标诊断对象的每种所述状况特征与该待定目标诊断对象对应的目标非同类对象的该状况特征的第二平均距离;依次根据所述第二目标诊断对象集合中每个所述待定目标诊断对象的每种状况特征对应的所述第一平均距离和所述第二平均距离确定每种所述状况特征对应的第一特征权重。3.根据权利要求2所述的方法,其特征在于,所述获取所述第一目标诊断对象集合中每个所述待定目标诊断对象对应的目标同类对象和目标非同类对象,包括:在所述待定目标诊断对象为目标病例对象的情况下,获取所述待定目标诊断对象与所述第一目标诊断对象集合中目标病例对象的第一目标距离,并获取所述待定目标诊断对象与所述第一目标诊断对象集合中非目标病例对象的第二目标距离,将所述第一目标诊断对象集合中所述第一目标距离最小的预设数量个目标病例对象作为所述目标同类对象,将所述第一目标诊断对象集合中所述第二目标距离最小的所述预设数量个非目标病例对象作为所述目标非同类对象;在所述待定目标诊断对象为非目标病例对象的情况下,获取所述待定目标诊断对象与所述第一目标诊断对象集合中目标病例对象的第三目标距离,和所述待定目标诊断对象与
所述第一目标诊断对象集合中非目标病例对象的第四目标距离,将所述第一目标诊断对象集合中所述第四目标距离最小的预设数量个非目标病例对象作为所述目标同类对象,将所述第一目标诊断对象集合中所述第三目标距离最小的预设数量个目标病例对象作为所述目标非同类对象。4.根据权利要求2所述的方法,其特征在于,所述依次根据所述第二目标诊断对象集合中每个所述待定目标诊断对象的每种状况特征对应的所述第一平均距离和所述第二平均距离确定每种所述状况特征对应的第一特征权重,包括:获取每种所述状况特征对应的第一预设初始特征权重;遍历所述第二目标诊断对象集合中每个所述待定目标诊断对象的每种状况特征,执行以下权重调节步骤,以得到每种所述状况特征更新后的所述第一预设初始特征权重,并将每种所述状况特征更新后的所述第一预设初始特征权重作为该状况特征对应的第一特征权重;其中,所述权重调节步骤包括:在所述第一平均距离小于所述第二平均距离的情况下,将当前所述状况特征的所述第一预设初始特征权重增加第一预设权重阈值;在所述...
【专利技术属性】
技术研发人员:郑铭鑫,曹延泽,刘长虹,韩宇,陆可,孙海伦,吴迪,李博文,
申请(专利权)人:东软集团股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。