【技术实现步骤摘要】
一种特征重要性排序方法、装置、设备和存储介质
本专利技术实施例涉及信息处理领域,尤其涉及一种特征重要性排序方法、装置、设备和存储介质。
技术介绍
越来越多的行业开始重视大数据客户洞察的应用,例如银行、保险企业。基于对大数据的分析挖掘和机器学习等技术,提供客户画像、行为预测以及智能推荐等服务。例如保险企业基于对客户数据的分析,构建意外险客群画像,可以帮助了解客户,实现对客户的精准营销,提升客户满意度。现有的意外险客群画像一般基于保险公司内部数据,对内部数据进行分析进而对潜在客户进行挖掘。然而这种模型的构建方法缺少对外部数据的引入和整合,无法客观全面的反映意外险客群特征,并且缺少对客户特征的重要性筛选,只是针对所获取的数据进行简单筛选,缺少对客户特征的针对性分析。
技术实现思路
本专利技术实施例提供一种特征重要性排序方法、装置、设备和存储介质,以提高特征重要性排序的准确度。第一方面,本专利技术实施例提供了一种特征重要性排序方法,包括:确定样本对象的特征以及样本对象的购买行为标签; >确定所述特征与购买本文档来自技高网...
【技术保护点】
1.一种特征重要性排序方法,其特征在于,包括:/n确定样本对象的特征以及样本对象的购买行为标签;/n确定所述特征与购买行为标签的相关性,并根据所述相关性筛选出至少两个待排序的特征;/n根据样本对象的所述至少两个待排序的特征得到特征排序模型,并依据特征排序模型得到至少两个待排序的特征的重要性排序结果。/n
【技术特征摘要】
1.一种特征重要性排序方法,其特征在于,包括:
确定样本对象的特征以及样本对象的购买行为标签;
确定所述特征与购买行为标签的相关性,并根据所述相关性筛选出至少两个待排序的特征;
根据样本对象的所述至少两个待排序的特征得到特征排序模型,并依据特征排序模型得到至少两个待排序的特征的重要性排序结果。
2.根据权利要求1所述的方法,其特征在于,在得到至少两个待排序的特征的重要性排序结果之后,所述方法还包括:
对所述特征的重要性排序结果中的特征进行正负相关性判断,从而根据特征的正负相关性分别对特征进行重要性排序。
3.根据权利要求2所述的方法,其特征在于,对所述特征的重要性排序结果中的特征进行正负相关性判断,包括:
利用所述特征的重要性排序结果中的特征训练回归模型,得到回归方程,根据回归方程的回归系数的正负来判断特征的正负相关性;其中,若所述回归系数为正数,则对应特征的相关性为正相关;若所述回归系数为负数,则对应特征的相关性为负相关。
4.根据权利要求1所述的方法,其特征在于,确定所述特征与购买行为标签的相关性,并根据所述相关性筛选出至少两个待排序的特征,包括:
构建特征与购买行为标签之间的相关性表现,获取相关性系数;其中,所述相关性表现包括线性表现和非线性表现;
根据所述相关性系数从所述特征中筛选出所述相关性系数满足预设条件的目标特征;其中,预设条件包括相关性系数达到预设相关阈值,或者,将所述特征按照相关性系数从大到小进行排序后,排序在预设顺序以前。
5.根据权利要求1所述的方法,其特征在于,确定样本对象的特征以及样本对象的购买行为标签,还包括:
对所述样本对象的特征进行预处理操作,得到预处理后的样本对象的特征;其中,预处理操作至少包括缺失值处理和/或异常值处理,
相应的,确定所述特征...
【专利技术属性】
技术研发人员:邓杨,高宏华,王杰明,傅立霖,张佳煌,
申请(专利权)人:中国建设银行股份有限公司,建信金融科技有限责任公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。