使用基于分类器集成的遗传算法进行特征选择的方法技术

技术编号:5442910 阅读:218 留言:0更新日期:2012-04-11 18:40
本文提供了用于执行基于遗传算法的特征选择的方法。在某些实施例 中,所述方法包括以下步骤:将多个数据分割模式应用于学习数据集以建 立多个分类器进而获得至少一个分类结果;整合来自所述多个分类器的所 述至少一个分类结果以获得整合的准确度结果;以及将所述整合的准确度 结果作为用于候选特征子集的适应度值输出到遗传算法,其中执行基于遗 传算法的特征选择。

【技术实现步骤摘要】
【国外来华专利技术】本申请要求2006年9月22日提交的序列号为60/826,593的美国临时 申请的权益,上述申请的全部内容以引用方式并入本文中。提供了使用遗传算法进行特征选择的方法。遗传算法(GA)是用于作为搜索技术计算以找出优化和搜索问题的解 决方案的一类演化算法。GA使用术语和概念来发展受到演化生物学启发的 技术,包括诸如遗传、突变、选择和交叉这样的概念。特征选择也被称为子集选择或变量选择,是一种在机器学习中使ffl的 方法。在将学习算法应用于数据集之前,选择可从该数据集获得的子集。 使用特征选择的过程,原因在于使用数据集中所有可获得的特征在计算上 是不可行的。当数据集具有包含大量特征的有限数据样本时特征选择也用 于使估计和过适应度的问题尽量少的发生。利用特征选择的典型领域是计算机辅助诊断(CADx)。 CADx是一种 使用机器学习技术来预测医疗结果,例如将未知病变分类为恶性或良性的 方法。例如,在用于肺癌诊断的肺的计算机断层摄影(CT)成像中,这些 输入特征可以包括应用于待研究的肺结节的图像处理算法的结果。提高 CADx系统的诊断准确度是将该技术成功引入临床中的关键步骤。由于对于每个病变可能需要本文档来自技高网...

【技术保护点】
一种用于执行基于遗传算法的特征选择的方法,所述方法包括: 将多个数据分割模式应用于学习数据集以建立多个分类器,进而获得至少一个分类结果; 整合来自所述多个分类器的所述至少一个分类结果以获得整合的准确度结果;以及 将所述整合 的准确度结果作为用于候选特征子集的适应度值输出到遗传算法,其中,执行基于遗传算法的特征选择。

【技术特征摘要】
【国外来华专利技术】2006.9.22 US 60/826,593;2007.1.10 US 60/884,2881、一种用于执行基于遗传算法的特征选择的方法,所述方法包括将多个数据分割模式应用于学习数据集以建立多个分类器,进而获得至少一个分类结果;整合来自所述多个分类器的所述至少一个分类结果以获得整合的准确度结果;以及将所述整合的准确度结果作为用于候选特征子集的适应度值输出到遗传算法,其中,执行基于遗传算法的特征选择。2、 根据权利要求1所述的方法,还包括使用所述遗传算法获得所述候 选特征子集。3、 根据权利要求1所述的方法,其中,所述多个数据分割模式将所述学习数据集分成训练数据和测试数据。4、 根据权利要求1所述的方法,其中,所述多个分类器选自下列的至少一个组成的组支持向量机、决策树、线性判别分析和神经网络。5、 根据权利要求1所述的方法,其中,建立所述多个分类器还包括使用再采样技术从所述学习数据集获得多个训练集和多个测试集中的毎-个。6、 根据...

【专利技术属性】
技术研发人员:L·赵L·博罗茨基L·A·阿尼霍特里M·C·C·李
申请(专利权)人:皇家飞利浦电子股份有限公司
类型:发明
国别省市:NL

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1