一种特征维度筛选方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:38207844 阅读:17 留言:0更新日期:2023-07-21 16:56
本公开提供了一种特征维度筛选方法、装置、计算机设备及存储介质,其中,该方法包括:获取样本数据集;其中,所述样本数据集中的每个样本数据包含在待筛选的多个特征维度下的特征数据;基于各样本数据在多个特征维度组合下的特征数据,对逻辑回归模型进行训练,确定每次训练使用的特征维度组合对应的分类性能指标值;所述分类性能指标值用于表征所述逻辑回归模型对各样本数据的分类能力;基于所述分类性能指标值,确定目标特征维度组合;其中,各样本数据在所述目标特征维度组合下的各特征数据用于进行神经网络训练。数据用于进行神经网络训练。数据用于进行神经网络训练。

【技术实现步骤摘要】
一种特征维度筛选方法、装置、计算机设备及存储介质


[0001]本公开涉及神经网络
,具体而言,涉及一种特征维度筛选方法、装置、计算机设备及存储介质。

技术介绍

[0002]特征工程是一项工程活动,目的是从原始数据中提取特征数据以供算法或模型使用。
[0003]相关技术中,在进行特征工程时,开发人员往往根据开发经验选择对原始数据采用何种处理方式进行处理,并对得到的特征数据的特征维度进行手动筛选和验证,以得到需要的目标特征维度下的特征数据。在这一过程中需要耗费较多的人力,筛选效率较低,另外,受限于开发人员的个人经验,选择出的目标特征维度可能难以满足实际需要,由此可能会导致后续网络模型训练效果较差的问题。

技术实现思路

[0004]本公开实施例至少提供一种特征维度筛选方法、装置、计算机设备及存储介质。
[0005]第一方面,本公开实施例提供了一种特征维度筛选方法,包括:
[0006]获取样本数据集;其中,所述样本数据集中的每个样本数据包含在待筛选的多个特征维度下的特征数据;
[0007]基于各样本本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种特征维度筛选方法,其特征在于,包括:获取样本数据集;其中,所述样本数据集中的每个样本数据包含在待筛选的多个特征维度下的特征数据;基于各样本数据在多个特征维度组合下的特征数据,对逻辑回归模型进行训练,确定每次训练使用的特征维度组合对应的分类性能指标值;所述分类性能指标值用于表征所述逻辑回归模型对各样本数据的分类能力;基于所述分类性能指标值,确定目标特征维度组合;其中,各样本数据在所述目标特征维度组合下的各特征数据用于进行神经网络训练。2.根据权利要求1所述的方法,其特征在于,所述基于各样本数据在多个特征维度组合下的特征数据,对逻辑回归模型进行训练,包括:将待筛选的多个特征维度中的每个特征维度分别作为一个候选特征维度组合,基于所述样本数据在各所述候选特征维度组合下的特征数据,对逻辑回归模型进行训练,确定各候选特征维度组合对应的分类性能指标值;基于各候选特征维度组合对应的分类性能指标值,从各候选特征维度组合中确定分类性能指标值最高的候选特征维度组合,作为中间特征维度组合;将待筛选的多个特征维度中,除所述中间特征维度组合外的每个特征维度分别加入所述中间特征维度组合,得到各个更新后的候选特征维度组合;返回基于所述样本数据在各所述候选特征维度组合下的特征数据,对逻辑回归模型进行训练的步骤,直至达到预设的截止条件,将最后得到的中间特征维度组合作为所述目标特征维度组合;其中,所述截止条件包括返回执行所述训练的轮数达到预设轮数,和/或,当前轮得到的所述中间特征维度组合的分类性能指标值,与上一轮的得到的所述中间特征维度组合的分类性能指标值的差值小于设定阈值。3.根据权利要求2所述的方法,其特征在于,所述基于所述样本数据在各所述候选特征维度组合下的特征数据,对逻辑回归模型进行训练,包括:根据当前轮训练过程中使用的所述候选特征维度组合中特征维度的个数,对当前轮使用的样本数据进行切分,得到多份样本数据;从所述多份样本数据中确定本轮训练过程中每次训练使用的样本数据,基于确定的样本数据对逻辑回归模型进行训练;其中,每次训练使用的样本数据的份数随训练次数的增加而增加,且每次训练使用的候选特征维度组合的数量随训练次数的增加而减少。4.根据权利要求3所述的方法,其特征在于,在每一轮所述训练中,根据以下步骤确定每次训练使用的候选特征组合;选取全部候选特征维度组合作为首次训练使用的候选特征维度组合;在得到当前次训练的各个候选特征维度组合的分类性能指标值后,将各个候选特征维度组合按照分类性能指标值从高到底的顺序进行排序后,按照预设比例选取排序在前的候选特征维度组合,作为下一次训练使用的候选特征维度组合。5.根据权利要求2所述的方法,其特征在于,所述基于所述分类性能指标值,确定目标特征维度组合...

【专利技术属性】
技术研发人员:刘宇
申请(专利权)人:抖音视界有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1