【技术实现步骤摘要】
特征组合筛选方法、装置、计算机设备及存储介质
本专利技术涉及计算机
,尤其涉及一种特征组合筛选方法、装置、计算机设备及存储介质。
技术介绍
在基于神经网络构建分析模型、预测模型的过程中,需使用多个特征作为模型的输入节点,为体现多个特征之间的关联关系,可将多个特征进行组合以得到组合特征。传统的模型构建过程中均是通过人工选择的方式对特征进行组合及筛选后将得到的部分组合特征作为模型的输入节点,然而传统的特征组合筛选方法在获取组合特征时的效率较低,导致无法高效率地对模型进行构建。因而,现有的技术方法存在特征组合筛选效率较低的问题。
技术实现思路
本专利技术实施例提供了一种特征组合筛选方法、装置、计算机设备及存储介质,旨在解决现有技术方法中所存在对特征进行组合及筛选的效率不高的问题。第一方面,本专利技术实施例提供了一种特征组合筛选方法,其包括:若接收到用户所输入的数据信息表,根据预设的特征组合规则从所述数据信息表中获取与所述特征组合规则对应的多个组合特征;根据所述组合特征对所述数据信息 ...
【技术保护点】
1.一种特征组合筛选方法,其特征在于,包括:/n若接收到用户所输入的数据信息表,根据预设的特征组合规则从所述数据信息表中获取与所述特征组合规则对应的多个组合特征;/n根据所述组合特征对所述数据信息表进行二值化以得到多个单月二维矩阵;/n根据预设的矩阵计算模型对所有所述单月二维矩阵进行计算以得到每一所述组合特征对应的特征计算信息;其中,所述特征计算信息包括逐月饱和度、逐月重要度、饱和度变异系数及重要度变异系数;/n根据预设的获取规则及所述特征计算信息对所有所述组合特征的进行筛选以得到满足所述获取规则的目标组合特征;其中,所述获取规则包括保留规则及剔除规则。/n
【技术特征摘要】
1.一种特征组合筛选方法,其特征在于,包括:
若接收到用户所输入的数据信息表,根据预设的特征组合规则从所述数据信息表中获取与所述特征组合规则对应的多个组合特征;
根据所述组合特征对所述数据信息表进行二值化以得到多个单月二维矩阵;
根据预设的矩阵计算模型对所有所述单月二维矩阵进行计算以得到每一所述组合特征对应的特征计算信息;其中,所述特征计算信息包括逐月饱和度、逐月重要度、饱和度变异系数及重要度变异系数;
根据预设的获取规则及所述特征计算信息对所有所述组合特征的进行筛选以得到满足所述获取规则的目标组合特征;其中,所述获取规则包括保留规则及剔除规则。
2.根据权利要求1所述的特征组合筛选方法,其特征在于,所述根据预设的特征组合规则从所述数据信息表中获取与所述特征组合规则对应的多个组合特征,包括:
根据所述数据信息表中所包含的项目获取与所述项目数量相同的多个特征;
根据所述特征组合规则中的预设特征数对所有所述特征进行组合以得到多个组合特征。
3.根据权利要求1所述的特征组合筛选方法,其特征在于,所述根据所述组合特征对所述数据信息表进行二值化以得到多个单月二维矩阵,包括:
根据月份信息对所述数据信息表进行拆分以得到多个单月数据信息;
获取每一所述单月数据信息中与所有所述组合特征对应的数据信息作为单月特征数据;
根据所有所述组合特征对每一所述单月特征数据进行二值化以得到多个单月二维矩阵。
4.根据权利要求1所述的特征组合筛选方法,其特征在于,所述根据预设的矩阵计算模型对所有所述单月二维矩阵进行计算以得到每一所述组合特征对应的特征计算信息,包括:
根据所述矩阵计算模型中的饱和度计算公式计算所有单月二维矩阵中每一组合特征对应的饱和度以得到每一所述组合特征的逐月饱和度;
根据所述矩阵计算模型中的重要度计算公式计算所有单月二维矩阵中每一组合特征对应的重要度以得到每一所述组合特征的逐月重要度;
根据所述矩阵计算模型中的饱和度变异系数公式计算得到每一所述组合特征的饱和度变异系数,其中,Bi为组合特征i的饱和度变异系数,FTi为组合特征i在所有月份中饱和度的标准差,为组合特征i在所有月份中的饱和度平均值;
根据所述矩阵计算模型中的重要度变异系数公式计算得到每一所述组合特征的重要度变异系数,其中,Zi为组合特征i的重要度变异系数,FUi为组合特征i在所有月份中重要度的标准差,为组合特征i在所有月份中的重要度平均值。
5.根据权利要求1所述的特征组合筛选方法,其特征在于,所述根据预设的获取规...
【专利技术属性】
技术研发人员:陈远波,
申请(专利权)人:中国平安人寿保险股份有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。