【技术实现步骤摘要】
用户分类方法、用户分类装置、存储介质与电子设备
[0001]本公开涉及数据处理
,尤其涉及一种用户分类方法、用户分类装置、计算机可读存储介质与电子设备。
技术介绍
[0002]目前,针对二分类场景中的用户类型划分,主要是按照一定的业务标准将用户划分为两个类别的,例如,在评估用户信用度时,可以按照业务标准计算特征的信息价值量,将用户划分为高信用度用户和低信用度用户。
[0003]然而,随着业务场景的不断多样化和复杂化,往往需要将用户划分为多个类别,现有的计算信息量的方法虽然具备良好的解释性,但却无法适用于多分类的业务场景。因此,需要提供一种能够兼具多分类和可解释性的用户分类方法。
[0004]需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
[0005]本公开提供了一种用户分类方法、用户分类装置、计算机可读存储介质与电子设备,进而至少在一定程度上改善现有技术无法兼顾用户分类方法的可解释性和多 ...
【技术保护点】
【技术特征摘要】
1.一种用户分类方法,其特征在于,所述方法包括:获取多个用户的用户数据,所述用户数据包括多个特征变量的特征数据和各所述用户的初始类别标签;按照所述初始类别标签将所述用户数据划分为多个包括正例数据和负例数据的数据组合;对每个数据组合中的正例数据和负例数据进行处理,确定各所述特征变量的特征评分;根据各所述特征变量的特征评分,筛选出所述多个特征变量中的目标特征变量,并通过所述目标特征变量对应的特征数据将所述多个用户划分为多个类别。2.根据权利要求1所述的方法,其特征在于,所述按照所述初始类别标签将所述用户数据划分为多个包括正例数据和负例数据的数据组合,包括:以所述初始类别标签中的至少一个类别标签对应的用户数据为正例数据,以除所述至少一个类别标签外的其他类别标签对应的用户数据为负例数据,将所述用户数据转换为多个包括正例数据和负例数据的第一数据组合;以及以所述初始类别标签中的任意一个类别标签对应的用户数据为正例数据,以除所述任意一个类别标签外的其他任意一个类别标签对应的用户数据为负例数据,将所述用户数据转换为多个包括正例数据和负例数据的第二数据组合。3.根据权利要求2所述的方法,其特征在于,所述特征评分包括各所述特征变量的信息量,所述对每个数据组合中的正例数据和负例数据进行处理,确定各所述特征变量的特征评分,包括:对于所述第一数据组合和所述第二数据组合中的各个数据组合,根据每个数据组合中的正例样本数量和负例样本数量,确定各所述特征变量在各个数据组合中的信息量;按照各所述数据组合的组合类别,对各所述特征变量在各个数据组合中的信息量进行求和,得到所述第一数据组合对应的第一特征信息量和所述第二数据组合对应的第二特征信息量;根据所述第一特征信息量和所述第二特征信息量确定各所述特征变量的信息量。4.根据权利要求3所述的方法,其特征在于,所述根据所述每个数据组合中的正例样本数量和负例样本数量,确定各所述特征变量在各个数据组合中的信息量,包括:对各所述特征变量进行分箱,并计算各所述特征变量对应的每箱变量的证据权重;在所述每个数据组合中,分别计算各所述特征变量对应的每箱变量的正例样本率和负例样本率;基于各所述特征变量对应的每箱变量的证据权重,对各所述特征变量对应的每箱变量的正例样...
【专利技术属性】
技术研发人员:李翔,贾炎,齐洁,于福超,
申请(专利权)人:中国电信股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。