【技术实现步骤摘要】
一种特征选择方法、装置、存储介质和设备
[0001]本申请涉及机器学习领域,尤其涉及一种特征选择方法、装置、存储介质和设备。
技术介绍
[0002]边缘计算作为一种新型计算模式,其核心原则之一是将计算能力推向边缘。边缘计算的核心理念是将数据的存储、传输、计算和安全交给边缘节点来处理,大量实时的需要交互的计算将在边缘节点完成,同时边缘设备的计算能力非常有限,不像云端服务器可以处理大规模的运算,因此,我们需要不断设法去提高边缘节点的计算效率。
[0003]随着人工智能的快速发展,许多机器学习模型被部署到了边缘节点当中,对于机器学习模型来说,输入特征数是影响模型计算效率的一个重要因素。从原始特征中选择部分最有利于模型分类的特征不仅可以减少模型的运算时间,同时也减小了冗余特征和对分类没有帮助的特征对分类结果的影响,提高分类精度。
[0004]为此,如何提高机器学习模型在边缘计算环境下的计算效率,成为本领域亟需解决的问题。
技术实现思路
[0005]申请人发现:现有的机器学习模型在边缘计算环境下计算效率 ...
【技术保护点】
【技术特征摘要】
1.一种特征选择方法,其特征在于,包括:预先获取经由对原始数据进行特征工程所得到的各个特征;利用ReliefF算法,计算各个所述特征的权重;删除权重小于预设权重阈值的特征,并将剩余的特征标识为有效特征;调用预设的适应度函数,对基于各个所述有效特征初始化得到的粒子群中的每个粒子进行适应度评估,并通过预设粒子群算法,迭代更新每个所述粒子的位置和速度,得到每个所述粒子的最终适应度;其中,所述适应度函数的参数项包括特征子集在预设分类器上的分类效果、所述特征子集的重要性、所述特征子集所包含的有效特征的数量;所述特征子集的重要性,基于所述特征子集中所包含的有效特征的权重所确定;每个所述粒子均代表一个所述特征子集;所述特征子集包括多个所述有效特征;选取最终适应度最小的特征子集中所包含的有效特征,作为所述机器学习模型的训练特征。2.根据权利要求1所述的方法,其特征在于,所述利用ReliefF算法,计算各个所述特征的权重,包括:基于各个所述特征,构建特征集;依据抽样步骤对所述特征集进行多次抽样;其中,所述抽取步骤包括:从所述特征集中随机选择一个样本,并从和所述样本同类的其它样本中选取多个最近邻样本,作为第一最近邻样本,以及从和所述样本不同的每一类的其它样本中选取多个最近邻样本,作为第二最近邻样本;将所述样本、所述第一最近邻样本和所述第二最近邻样本,代入预设的迭代计算公式中,计算得到每个所述特征的权重。3.根据权利要求1所述的方法,其特征在于,所述调用预设的适应度函数,对基于各个所述有效特征初始化得到的粒子群中的每个粒子进行适应度评估,并通过预设粒子群算法,迭代更新每个所述粒子的位置和速度,得到每个所述粒子的最终适应度,包括:从各个所述有效特征中,随机选取两个所述有效特征组合为特征子集;计算每个所述特征子集的互信息,并将每个所述特征子集的互信息均转换为互信息矩阵;基于各个所述互信息矩阵、预先设定的粒子数和每个粒子的特征数,构建粒子群;按照预设步骤对所述粒子群进行多次迭代更新,得到每个所述粒子的最终适应度;其中,所述预设步骤包括:利用预设的适应度函数,对所述粒子群中的每个所述粒子进行适应度评估,得到每个所述粒子的适应度;依据适应度最小的粒子的速度,对每个所述粒子的速度进行更新;依据适应度最小的粒子的位置,对每个所述粒子的位置进行更新。4.根据权利要求1所述的方法,其特征在于,所述特征子集的重要性,基于所述特征子集中所包含的有效特征的权重所确定,包括:对于所述特征子集中的每个有效特征,依据所述有效特征的权重,确定所述有效特征的重要性值;计算各个所述有效特征的重要性值的平均值,得到所述特征子集的重要性。5.一种面向边缘端机器学习模型的特征选择装置,其特征在于,包括:特征获取单元,用于预先获取经由对原始数据进行特征工程所得到的各个特征;
权重计算单元,用于...
【专利技术属性】
技术研发人员:王红凯,冯珺,潘司晨,江樱,琚小明,黄海潮,张烨华,彭梁英,赵帅,应张驰,王嘉琦,张澄心,
申请(专利权)人:浙江捷瑞电力科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。