【技术实现步骤摘要】
特征数据的处理方法以及电子设备
本申请实施例涉及人工智能
,并且更具体地,涉及特征数据的处理方法以及电子设备。
技术介绍
随着人工智能(ArtificialIntelligence,AI)
的不断发展,为了能够提高模型的训练效率,需要预先对训练样本的特征进行筛选。然而,现有技术中对训练样本的特征的筛选效果较差,缺少一个有效的特征筛选方案能够在保证模型的训练效率的同时提高模型的准确性。
技术实现思路
本申请实施例提供了一种特征数据的处理方法以及电子设备,能够在保证模型的训练效率的同时提高模型的准确性。第一方面,提供了一种特征数据的处理方法,包括:基于第一特征集合和决策树模型,进行第i次模型训练,得到该第一特征集合的特征排序结果,该特征排序结果用于表征该第一特征集合中的ni个特征在训练过程中的重要性排序,i≥1;按照该特征排序结果,从该第一特征集合中删除mi个特征;将该第一特征集合中剩余的ni-mi个特征,作为用于进行第i+1次模型训练的第一特征集合,mi≥1;基于该mi个特征,确 ...
【技术保护点】
1.一种特征数据的处理方法,其特征在于,包括:/n基于第一特征集合和决策树模型,进行第i次模型训练,得到所述第一特征集合的特征排序结果,所述特征排序结果用于表征所述第一特征集合中的n
【技术特征摘要】
1.一种特征数据的处理方法,其特征在于,包括:
基于第一特征集合和决策树模型,进行第i次模型训练,得到所述第一特征集合的特征排序结果,所述特征排序结果用于表征所述第一特征集合中的ni个特征在训练过程中的重要性排序,i≥1;
按照所述特征排序结果,从所述第一特征集合中删除mi个特征;
将所述第一特征集合中剩余的ni-mi个特征,作为用于进行第i+1次模型训练的第一特征集合,mi≥1;
基于所述mi个特征,确定第i次模型训练对应的目标特征;
在所述第i次模型训练对应的目标特征的数量大于预设值时,重复上述处理过程,直至所述目标特征的数量达到所述预设值时结束所述处理过程,得到最终的目标特征。
2.根据权利要求1所述的方法,其特征在于,所述按照所述特征排序结果,从所述第一特征集合中删除mi个特征,包括:
按照所述特征排序结果,从所述第一特征集合中删除重要性最高的mi个特征;
则所述基于所述mi个特征,确定第i次模型训练对应的目标特征,包括:
将所述mi个特征和累计删除特征,作为所述目标特征,所述累计删除特征包括每次模型训练后删除的m1+m2+…mi-1个特征。
3.根据权利要求1所述的方法,其特征在于,所述按照所述特征排序结果,从所述第一特征集合中删除mi个特征,包括:
按照所述特征排序结果,从所述第一特征集合中删除重要性最低的mi个特征;
则所述基于所述mi个特征,确定第i次模型训练对应的目标特征,包括:
将所述第一特征集合中除去mi个特征的ni-mi个特征,作为所述目标特征。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述方法还包括:
基于第二特征集合,通过交叉验证和所述决策树模型,确定所述预设值。
5.根据权利要求4所述的方法,其特征在于,所述基于第二特征集合,通过交叉验证和所述决策树模型,确定所述预设值,包括:
将所述第二特征集合划分为k个特征子集,k>1;
针对每个特征子集,基于所述特征子集和所述决策树模型,进行模型训练,得到k个模型针对每个特征数的评价指标;
基于所述k个特征子集在每个特征数下的评价指标,确定所述预设值。
6.根据权利要求1至3任一项所述的方法,其特征在于,所述在所述第i次模型训练对应的目标特征的数量大于预设值时,重复上述处理过程,直至所述目标特征的数量达到所述预设值时结束所述处理过程,得到最终的目标特征,具体包括:
在所述第i次模型训练对应的目标特征的数量大于预设值时,确定所述第i次模型训练得到的模...
【专利技术属性】
技术研发人员:杨斌,李正文,徐健,赵寒,吉雯清,刘哲文,
申请(专利权)人:重庆度小满优扬科技有限公司,
类型:发明
国别省市:重庆;50
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。