特征筛选方法、装置、存储介质及电子设备制造方法及图纸

技术编号:33305516 阅读:52 留言:0更新日期:2022-05-06 12:14
本公开涉及一种特征筛选方法、装置、存储介质及电子设备,该方法通过根据多个目标诊断对象的指定特征数据,确定每种该状况特征对应的第一特征权重和第二特征权重;根据每种该状况特征对应的该第一特征权重和该第二特征权重确定该状况特征的目标特征权重,该目标特征权重用于表征该状况特征对于确定该目标诊断对象为该目标病例对象或者该非目标病例对象的重要程度;根据每种该状况特征对应的该目标特征权重从多种该状况特征中确定该目标状况特征,能够有效提高特征筛选结果的可靠性,也能够有效减少特征筛选所需的计算量,从而不仅能够有效提升特征筛选速率,也能够为医疗科研人员的后期诊断和后期模型训练提供可靠的数据依据。据依据。据依据。

【技术实现步骤摘要】
特征筛选方法、装置、存储介质及电子设备


[0001]本公开涉及数据处理领域,具体地,涉及一种特征筛选方法、装置、存储介质及电子设备。

技术介绍

[0002]特征筛选是机器学习领域中一个重要的数据预处理过程,特征筛选的目的是在数据维度较大的情况下,从众多维度的特征数据中筛选出对模型识别结果影响较大的特征数据,尤其是在银屑病诊断的相关研究中,发现银屑病患者的病变特征较多,例如关节病变,肌腱病变,滑囊病变,其中在关节病变特征中又包括骶髂关节积液状况特征,骶髂关节血流状况特征,骶髂关节骨赘状况特征,髋关节积液状况特征、髋关节腕血流状况特征,髋关节骨赘状况特征,腕关节积液状况特征,腕关节血流状况特征,腕关节骨赘状况特征,肘关节积液状况特征,肘关节血流状况特征,肘关节血流状况特征等等,另外在肌腱病变与滑囊病变中,也会包括积液、血流、骨赘等状况特征,这就导致整个银屑病诊断过程涉及到的待诊断特征数量庞大,如此庞大的待诊断特征数据显然不利于医疗科研人员针对该银屑病的诊断,也不利于相关人体状态判断模型的训练,因此需要从众多的待诊断特征中筛选出相对重要的特征。
[0003]然而,目前的特征筛选方法通常要么存在特征筛选过程所需的计算量较大,特征筛选效率较低的问题,要么存在筛选结果可靠性较差,容易漏掉重要特征的问题。

技术实现思路

[0004]本公开的目的是提供一种特征筛选方法、装置、存储介质及电子设备。
[0005]为了实现上述目的,本公开第一方面提供一种特征筛选方法,所述方法包括:
[0006]获取多个目标诊断对象中每个所述目标诊断对象的指定特征数据,所述指定特征数据包括多种状况特征,以及所述目标诊断对象对应的类别标注数据,所述类别标注数据用于标注所述目标诊断对象为目标病例对象或者非目标病例对象;
[0007]根据所述多个目标诊断对象的所述指定特征数据,确定每种所述状况特征对应的第一特征权重和第二特征权重;
[0008]根据每种所述状况特征对应的所述第一特征权重和所述第二特征权重确定所述状况特征的目标特征权重,所述目标特征权重用于表征所述状况特征对于确定所述目标诊断对象为所述目标病例对象或者所述非目标病例对象的重要程度;
[0009]根据每种所述状况特征对应的所述目标特征权重从多种所述状况特征中确定所述目标状况特征。
[0010]本公开的第二方面提供一种特征筛选装置,所述装置包括:
[0011]获取模块,被配置为获取多个目标诊断对象中每个所述目标诊断对象的指定特征数据,所述指定特征数据包括多种状况特征,以及所述目标诊断对象对应的类别标注数据,所述类别标注数据用于标注所述目标诊断对象为目标病例对象或者非目标病例对象;
[0012]第一确定模块,被配置为根据所述多个目标诊断对象的所述指定特征数据,确定每种所述状况特征对应的第一特征权重和第二特征权重;
[0013]第二确定模块,被配置为根据每种所述状况特征对应的所述第一特征权重和所述第二特征权重确定所述状况特征的目标特征权重,所述目标特征权重用于表征所述状况特征对于确定所述目标诊断对象为所述目标病例对象或者所述非目标病例对象的重要程度;
[0014]第三确定模块,被配置为根据每种所述状况特征对应的所述目标特征权重从多种所述状况特征中确定所述目标状况特征。
[0015]本公开的第三方面提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现以上第一方面所述方法的步骤。
[0016]本公开的第四方面提供一种电子设备,包括:
[0017]存储器,其上存储有计算机程序;
[0018]处理器,用于执行所述存储器中的所述计算机程序,以实现以上第一方面所述方法的步骤。
[0019]上述技术方案,能够根据所述多个目标诊断对象的所述指定特征数据,确定每种所述状况特征的第一特征权重和第二特征权重,然后根据该第一特征权重和第二特征权重确定所述状况特征的目标特征权重,根据每种所述状况特征对应的所述目标特征权重从多种所述状况特征中确定所述目标状况特征,能够有效提高特征筛选结果的可靠性,也能够有效减少特征筛选所需的计算量,从而不仅能够有效提升特征筛选速率,也能够为医疗科研人员的后期诊断和后期模型训练提供可靠的数据依据。
[0020]本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
[0021]附图是用来提供对本公开的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本公开,但并不构成对本公开的限制。在附图中:
[0022]图1是本公开一示例性实施例示出的一种特征筛选方法的流程图;
[0023]图2是根据本公开图1所示实施例示出的一种特征筛选方法的流程图;
[0024]图3是根据本公开图1所示实施例示出的另一种特征筛选方法的流程图;
[0025]图4是根据本公开图1所示实施例示出的又一种特征筛选方法的流程图;
[0026]图5是本公开一示例性实施例示出的一种特征筛选装置的框图;
[0027]图6是根据一示例性实施例示出的一种电子设备的框图;
[0028]图7是根据一示例性实施例示出的另一种电子设备的框图。
具体实施方式
[0029]以下结合附图对本公开的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本公开,并不用于限制本公开。
[0030]在详细介绍本公开的具体实施方式之前,首先对本公开的应用场景进行以下说明,本公开可以应用于针对某种病例的诊断特征进行特征筛选的过程,例如,针对人体特征数据进行特征筛选,以得到对于诊断银屑病影响较大的状况特征的过程,也可以应用于训练人体状态判断模型前,对众多的人体特征数据进行数据预处理,以得到对于人体状态判
断影响较大的状况特征的过程中,这里以针对人体特征数据进行特征筛选,以得到对于诊断银屑病影响较大的状况特征的过程为例进行说明,在银屑病诊断的相关研究中,发现银屑病患者的病变特征较多,例如关节病变,肌腱病变,滑囊病变,其中在关节病变特征中又包括骶髂关节积液状况特征,骶髂关节血流状况特征,骶髂关节骨赘状况特征,髋关节积液状况特征、髋关节腕血流状况特征,髋关节骨赘状况特征,腕关节积液状况特征,腕关节血流状况特征,腕关节骨赘状况特征,肘关节积液状况特征,肘关节血流状况特征,肘关节血流状况特征等等,在肌腱病变于滑囊病变中,也会包括积液、血流、骨赘等状况特征,这就导致整个银屑病诊断过程涉及到的待诊断特征数量庞大,如此庞大的待诊断特征数据显然不利于医疗科研人员针对该银屑病的诊断,也不利于相关病情诊断模型的训练,因此需要从众多的待诊断特征中筛选出相对重要的特征。然而,目前的特征筛选通常要么是将人们主观印象中的重要特征作为特征筛选结果,要么是通过对不同的特征进行模型训练,然后从模型识别结果的准确度上来确定训练模型所用特征是否为重要特征,然而,专利技术人发现,以上将人们主观印象中的重要特征作为特征筛选本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种特征筛选方法,其特征在于,所述方法包括:获取多个目标诊断对象中每个所述目标诊断对象的指定特征数据,所述指定特征数据包括多种状况特征,以及所述目标诊断对象对应的类别标注数据,所述类别标注数据用于标注所述目标诊断对象为目标病例对象或者非目标病例对象;根据所述多个目标诊断对象的所述指定特征数据,确定每种所述状况特征对应的第一特征权重和第二特征权重;根据每种所述状况特征对应的所述第一特征权重和所述第二特征权重确定所述状况特征的目标特征权重,所述目标特征权重用于表征所述状况特征对于确定所述目标诊断对象为所述目标病例对象或者所述非目标病例对象的重要程度;根据每种所述状况特征对应的所述目标特征权重从多种所述状况特征中确定所述目标状况特征。2.根据权利要求1所述的方法,其特征在于,根据所述多个目标诊断对象的所述指定特征数据,确定每种所述状况特征对应的第一特征权重,包括:获取多个所述目标诊断对象中指定目标诊断对象与多个所述目标诊断对象中除所述指定目标诊断对象之外的其他目标诊断对象之间的欧式距离;将所述指定目标诊断对象与所述其他目标诊断对象中所述欧式距离小于第一预设距离阈值的目标诊断对象作为所述指定目标诊断对象对应的第一目标诊断对象集合中的元素;在确定所述第一目标诊断对象集合中包括多个目标病例对象和多个非目标病例的情况下,将所述第一目标诊断对象集合对应的所述指定目标诊断对象作为待定目标诊断对象,以得到由多个所述待定目标诊断对象组成的第二目标诊断对象集合;获取所述第一目标诊断对象集合中每个所述待定目标诊断对象对应的目标同类对象和目标非同类对象;获取每个所述待定目标诊断对象的每种所述状况特征与该待定目标诊断对象对应的目标同类对象的该状况特征的第一平均距离,以及每个所述待定目标诊断对象的每种所述状况特征与该待定目标诊断对象对应的目标非同类对象的该状况特征的第二平均距离;依次根据所述第二目标诊断对象集合中每个所述待定目标诊断对象的每种状况特征对应的所述第一平均距离和所述第二平均距离确定每种所述状况特征对应的第一特征权重。3.根据权利要求2所述的方法,其特征在于,所述获取所述第一目标诊断对象集合中每个所述待定目标诊断对象对应的目标同类对象和目标非同类对象,包括:在所述待定目标诊断对象为目标病例对象的情况下,获取所述待定目标诊断对象与所述第一目标诊断对象集合中目标病例对象的第一目标距离,并获取所述待定目标诊断对象与所述第一目标诊断对象集合中非目标病例对象的第二目标距离,将所述第一目标诊断对象集合中所述第一目标距离最小的预设数量个目标病例对象作为所述目标同类对象,将所述第一目标诊断对象集合中所述第二目标距离最小的所述预设数量个非目标病例对象作为所述目标非同类对象;在所述待定目标诊断对象为非目标病例对象的情况下,获取所述待定目标诊断对象与所述第一目标诊断对象集合中目标病例对象的第三目标距离,和所述待定目标诊断对象与
所述第一目标诊断对象集合中非目标病例对象的第四目标距离,将所述第一目标诊断对象集合中所述第四目标距离最小的预设数量个非目标病例对象作为所述目标同类对象,将所述第一目标诊断对象集合中所述第三目标距离最小的预设数量个目标病例对象作为所述目标非同类对象。4.根据权利要求2所述的方法,其特征在于,所述依次根据所述第二目标诊断对象集合中每个所述待定目标诊断对象的每种状况特征对应的所述第一平均距离和所述第二平均距离确定每种所述状况特征对应的第一特征权重,包括:获取每种所述状况特征对应的第一预设初始特征权重;遍历所述第二目标诊断对象集合中每个所述待定目标诊断对象的每种状况特征,执行以下权重调节步骤,以得到每种所述状况特征更新后的所述第一预设初始特征权重,并将每种所述状况特征更新后的所述第一预设初始特征权重作为该状况特征对应的第一特征权重;其中,所述权重调节步骤包括:在所述第一平均距离小于所述第二平均距离的情况下,将当前所述状况特征的所述第一预设初始特征权重增加第一预设权重阈值;在所述...

【专利技术属性】
技术研发人员:郑铭鑫曹延泽刘长虹韩宇陆可孙海伦吴迪李博文
申请(专利权)人:东软集团股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1