一种基于Stacking框架的特征选择方法技术

技术编号:30429672 阅读:43 留言:0更新日期:2021-10-24 17:20
本发明专利技术公开了一种基于Stacking框架的特征选择方法,使用K

【技术实现步骤摘要】
一种基于Stacking框架的特征选择方法


[0001]本专利技术涉及自然语言处理
,尤其涉及一种基于Stacking框架的特征选择方法。

技术介绍

[0002]特征选择是通过计算源数据中每个特征对最终模型输出结果的影响因子来进行选择与过滤,其主要用于数据高维特征空间的降维处理,来解决“维度灾难”问题。由于在众多研究领域的模型训练中,均能通过特征选择来降低源数据高维信息的语义矩阵维度,从而减少模型复杂度,达到缩短模型训练时间、降低训练成本的目的,因此,特征选择算法在学术界和行业得到广泛关注。例如在疾病诊断应用上,通常使用特征选择方法生成原始数据特征空间最优的特征子集,然后使用最优特征子集来判断一位就诊人员是否有患心脏病的风险。心脏病诊断的准确性和效率由所选择的特征子集和分类器决定。如果模型特征过多、复杂度高,诊断的准确率和效率就会降低。
[0003]传统的特征选择方法主要包括主成分分析法(PCA)、TF

IDF、互信息等。丁雪梅等使用调整的余弦相似度来度量特征间的相关性,提出一种基于Relief的无监督特征选择本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于Stacking框架的特征选择方法,其特征在于,包括以下步骤:步骤1:对输入的疾病数据进行清洗,分析各特征维度数据缺失情况并进行填充,并对数据进行标准化处理,得到更加规范的用于机器学习的数据集;步骤2:使用K

Fold交叉验证方式训练Stacking集成学习模型,并将步骤1得到的数据集输入到所述Stacking集成学习模型中进行训练,得到特征因子影响矩阵;步骤3:利用特征选择算法对所述特征因子影响矩阵进行选择,不断迭代删除冗余特征,最终输出分类器全局最高精确率和所对应的最优特征子集;步骤4:根据步骤3得到的最优特征子集构建基于Stacking框架的疾病诊断模型。2.根据权利要求1所述的一种基于Stacking框架的特征选择方法,其特征在于,步骤2中所述的Stacking集成学习模型分为两层架构:第一层组合不同的基学习器,包...

【专利技术属性】
技术研发人员:王海荣薛伟伟
申请(专利权)人:北方民族大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1