特征选择制造技术

技术编号：2925569 阅读：238 留言：0更新日期：2012-04-11 18:40

提供了一种可应用于特征的前向选择和后向消除的特征选择方法。所述方法基于每一个分类器的ＲＯＣ曲线下的面积的估算值选择特征作为分类器的输入。示例性应用是家庭护理或者患者监护、身体传感器网络、环境监控、图像处理和调查问卷设计。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及作为分类器的输入的特征的选择。具体地，而不是唯一地，这些特征表示例如家庭护理环境中的传感器网络中的传感器的输出。
技术介绍
在监督式机器学习(supervised machine learning)领域中用于维数降低的技术已经受到了广泛的关注。总体来说，存在两组方法特征提取和特征选择。在特征提取中，给定的特征被变换到较低维数的空间中，同时使信息的损失最小。一种特征提取技术是主成分分析(PCA )，该技术将多个相关的变量变换为多个不相关的变量(或者i成为、)。另一方面，对于特征选择，不创建新的特征。通过消除不相关和冗余的特征来降低维数。不相关(或者冗余)的特征基本不提供关于目标概念的信息(或者不提供新的信息)。特征选择的目的是通过消除不相关和冗余的特征来降低归纳系统的复杂性。在机器学习领域中，为了减少计算成本和存储量以及提高预测的准确性，这种技术正变得越来越重要。理论上，高维数模型比低维数模型更准确。然而，推理系统的计算成本随着其维数的增加而急剧提高，因此，需要根据总体计算成本来权衡准确性。另一方面，如果根据不充分的训练数据建立高维数模型，则该模型的准确性可能劣化。在这种情况下，该模型不能对信息结构提#4^人满意的描述。理解未知系统的固有结构所需的训练数据的量随着其维数的增大呈指数式地增大。当学习算法由于不相关的特征所导致的伪结构而变得混乱时，不准确的描述可能导致严重的过拟合(over-fitting)问题。为了获得在计算上容易处理的系统，需要消除对总体性能几乎没有贡献的含信息较少的特征。此外，收集大量的样...

【技术保护点】
一种自动选择特征作为用于多个类的分类器的输入的方法，包括：针对分类器的每一个类计算接收器操作特性曲线下的面积的估算值；以及根据所述估算值选择所述特征。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员：杨广中，胡晓鹏，
申请(专利权)人：皇家创新有限公司，
类型：发明
国别省市：GB[英国]

全部详细技术资料下载我是这个专利的主人