当前位置: 首页 > 专利查询>苏州大学专利>正文

一种医疗数据的特征选择方法及相关装置制造方法及图纸

技术编号:19430041 阅读:22 留言:0更新日期:2018-11-14 11:32
本申请公开了一种医疗数据的特征选择方法,包括:对获取的医疗数据进行标准化处理,得到标准化医疗数据;对所述标准化医疗数据进行权重向量稀疏计算处理,得到所述标准化医疗数据中特征对应的权重向量;根据所有所述权重向量对所有所述特征进行选择,得到最优特征集。通过在特征选择的权重向量计算过程进行稀疏处理,使不相关特征的权重向量趋近于0,减少多过无关特征被选入最优特征集,相当于减少的无关噪声,提高了处理高维数据时的精度。本申请还公开一种医疗数据的特征选择系统、特征选择装置以及计算机可读存储介质,具有上述有益效果。

【技术实现步骤摘要】
一种医疗数据的特征选择方法及相关装置
本申请涉及数据处理领域,特别涉及一种医疗数据的特征选择方法、特征选择系统、特征选择装置以及计算机可读存储介质。
技术介绍
随着计算机数据处理技术的发展,在医学数据分析领域,经常使用计算机的强大算力对大量的医学数据进行处理分析。通过对数据的分析,可以得到关于疾病数据分类情况,从中找出与疾病性状相关联的特征数据,即判断特征数据与疾病的相关性,从而促进疾病特征诊断的发展,辅助医生进行诊断。一般的,在一种现有技术中使用Relief(算法名称)算法对数据进行基础的处理分析,该算法计算给定样本的同类近邻和异类近邻之间的间隔,能够更好地解决有效样本信息量少、冗余过大以及数据之间彼此存在较强的相关性等问题。在另一种现有技术中通过LH-Relief算法(LocalHyperplaneRelief,局部超平面Relief)进行特征选择,通过该算法可以将分类的数据拓展到多分类的情况,而且在局部结构重构样本的近邻得到更加精确的近邻表示,提高了算法的分类精度。但是,随着算法和应用领域的不断拓展,需要处理的医学数据的维数越来越高,现有的特征选择算法无法很好的对高维的特诊数据进行选择,使算法处理后的数据仍然大量存在无关的特征数据,降低特征集与分类结果的相关性,使分类结果的准确率、精度以及召回率都有不同程度的下降。并且,随着数据的维数增多,特征选择的冗余度也大大增加,降低了分类结果的精度。因此,如何提高特征选择方法在处理高维数据时的精度是本领域技术人员所关注的重点问题。
技术实现思路
本申请的目的是提供一种医疗数据的特征选择方法、特征选择系统、特征选择装置以及计算机可读存储介质,通过在特征选择的权重向量计算过程进行稀疏处理,使不相关特征的权重向量趋近于0,减少多过无关特征被选入最优特征集,相当于减少的无关噪声,提高了处理高维数据时的精度。为解决上述技术问题,本申请提供一种医疗数据的特征选择方法,包括:对获取的医疗数据进行标准化处理,得到标准化医疗数据;对所述标准化医疗数据进行权重向量稀疏计算处理,得到所述标准化医疗数据中特征对应的权重向量;根据所有所述权重向量对所有所述特征进行选择,得到最优特征集。可选的,对获取的医疗数据进行标准化处理,得到标准化医疗数据,包括:对获取的所述医疗数据进行离差标准化处理,得到标准化医疗数据。可选的,对所述标准化医疗数据进行权重向量稀疏计算处理,得到所述标准化医疗数据中特征对应的权重向量,包括:构造优化目标函数,向所述优化目标函数添加所述L1范数的惩罚项得到稀疏优化目标函数;根据所述稀疏优化目标函数对所述标准化医疗数据重复进行计算,直到当前得到的特征对应的权重向量与上一次计算得到的特征对应的权重向量的差值小于阈值,得到每个所述特征对应的权重向量。可选的,根据所有所述权重向量对所有所述特征进行选择,得到最优特征集,包括:根据所有所述权重向量对所有所述特征进行排序,得到特征排序集;计算每个特征之间的相对熵,并根据所述相对熵和所述权重向量选择所述特征排序集中的特征到所述最优特征集,得到所述最优特征集。本申请还提供一种医疗数据的特征选择系统,包括:标准化处理模块,用于对获取的医疗数据进行标准化处理,得到标准化医疗数据;权重向量计算模块,用于对所述标准化医疗数据进行权重向量稀疏计算处理,得到所述标准化医疗数据中特征对应的权重向量;最优特征获取模块,用于根据所有所述权重向量对所有所述特征进行选择,得到最优特征集。可选的,所述标准化处理模块具体用于对获取的所述医疗数据进行离差标准化处理,得到标准化医疗数据。可选的,所述权重向量计算模块包括:优化函数获取单元,用于构造优化目标函数,向所述优化目标函数添加所述L1范数的惩罚项得到稀疏优化目标函数;权重向量计算单元,用于根据所述稀疏优化目标函数对所述标准化医疗数据重复进行计算,直到当前得到的特征对应的权重向量与上一次计算得到的特征对应的权重向量的差值小于阈值,得到每个所述特征对应的权重向量。可选的,所述最优特征获取模块包括:特征排序单元,用于根据所有所述权重向量对所有所述特征进行排序,得到特征排序集;特征选取单元,用于计算每个特征之间的相对熵,并根据所述相对熵和所述权重向量选择所述特征排序集中的特征到所述最优特征集,得到所述最优特征集。本申请还提供一种医疗数据的特征选择装置,包括:存储器,用于存储计算机程序;处理器,用于执行所述计算机程序时实现如上所述的特征选择方法的步骤。本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的特征选择方法的步骤。本申请所提供的一种医疗数据的特征选择方法,包括:对获取的医疗数据进行标准化处理,得到标准化医疗数据;对所述标准化医疗数据进行权重向量稀疏计算处理,得到所述标准化医疗数据中特征对应的权重向量;根据所有所述权重向量对所有所述特征进行选择,得到最优特征集。通过在特征选择的权重向量计算过程对权重向量进行稀疏处理,使不相关特征的权重向量趋近于0,减少被选入最优特征集的无关特征,相当于减少的无关噪声,避免了无用特征对正确分类预测的影响,提高了处理高维数据时的精度。并且通过选择后的特征以较少数量的特征就完成了高精时度的分类处理,提高了分类处理的效率,使计算机性能得到了充分利用,也即提高了计算机的运行性能。本申请还提供一种医疗数据的特征选择系统、特征选择装置以及计算机可读存储介质,具有上述有益效果,在此不做赘述。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1为本申请实施例所提供的一种医疗数据的特征选择方法的流程图;图2为本申请实施例所提供的另一种医疗数据的特征选择方法的流程图;图3为本申请实施例所提供的一种医疗数据的特征选择系统的结构示意图。具体实施方式本申请的核心是提供一种医疗数据的特征选择方法、特征选择系统、特征选择装置以及计算机可读存储介质,通过在特征选择的权重向量计算过程加入L1范数进行计算处理,也就是对权重向量进行稀疏处理,使不相关特征的权重向量趋近于0,减少多过无关特征被选入最优特征集,相当于减少的无关噪声,提高了处理高维数据时的精度。为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。请参考图1,图1为本申请实施例所提供的一种医疗数据的特征选择方法的流程图。本实施例提供一种医疗数据的特征选择方法,该方法可以提高对高维数据的分类精度,该方法可以包括:S101,对获取的医疗数据进行标准化处理,得到标准化医疗数据;本步骤旨在对获取的医疗数据进行预处理,也就是标准化处理,得到标准化医疗数据。所得到的医疗数据,一般由于各项特征指标的性质不同,通常具有不同的量纲和数量级。本文档来自技高网...

【技术保护点】
1.一种医疗数据的特征选择方法,其特征在于,包括:对获取的医疗数据进行标准化处理,得到标准化医疗数据;对所述标准化医疗数据进行权重向量稀疏计算处理,得到所述标准化医疗数据中特征对应的权重向量;根据所有所述权重向量对所有所述特征进行选择,得到最优特征集。

【技术特征摘要】
1.一种医疗数据的特征选择方法,其特征在于,包括:对获取的医疗数据进行标准化处理,得到标准化医疗数据;对所述标准化医疗数据进行权重向量稀疏计算处理,得到所述标准化医疗数据中特征对应的权重向量;根据所有所述权重向量对所有所述特征进行选择,得到最优特征集。2.根据权利要求1所述的特征选择方法,其特征在于,对获取的医疗数据进行标准化处理,得到标准化医疗数据,包括:对获取的所述医疗数据进行离差标准化处理,得到标准化医疗数据。3.根据权利要求2所述的特征选择方法,其特征在于,对所述标准化医疗数据进行权重向量稀疏计算处理,得到所述标准化医疗数据中特征对应的权重向量,包括:构造优化目标函数,向所述优化目标函数添加所述L1范数的惩罚项得到稀疏优化目标函数;根据所述稀疏优化目标函数对所述标准化医疗数据重复进行计算,直到当前得到的特征对应的权重向量与上一次计算得到的特征对应的权重向量的差值小于阈值,得到每个所述特征对应的权重向量。4.根据权利要求3所述的特征选择方法,其特征在于,根据所有所述权重向量对所有所述特征进行选择,得到最优特征集,包括:根据所有所述权重向量对所有所述特征进行排序,得到特征排序集;计算每个特征之间的相对熵,并根据所述相对熵和所述权重向量选择所述特征排序集中的特征到所述最优特征集,得到所述最优特征集。5.一种医疗数据的特征选择系统,其特征在于,包括:标准化处理模块,用于对获取的医疗数据进行标准化处理,得到标准化医疗数据;权重向量计算模块,用于对所述标准化医疗数据...

【专利技术属性】
技术研发人员:张莉黄晓娟王邦军张召凌兴宏姚望舒李凡长
申请(专利权)人:苏州大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1