本发明专利技术提供一种用户分类方法及系统,属于大数据技术领域。该用户分类方法包括:获取用户数量、用户分类数量和用户特征;根据所述用户特征构造约束矩阵;根据用户数量和用户分类数量确定秩约束条件;判断约束矩阵是否满足秩约束条件,根据判断结果对用户进行分类。本发明专利技术可以快速精准地对用户进行分类,从而针对各类用户提供个性化服务,提高用户体验和用户粘性。
【技术实现步骤摘要】
用户分类方法及系统
本专利技术涉及大数据
,具体地,涉及一种用户分类方法及系统。
技术介绍
大数据和人工智能的发展为银行业带来了大量用户,然而大量用户对银行业的传统策略带来了挑战,使得银行用户群体虽然庞大,推出的产品也越来越多样化,然而忠实用户数目却不见有巨大增长。如果能从大量的用户中挖掘出有价值的用户并对各类用户提供针对性的服务,对银行业占有市场份额,提高忠实用户数量具有很大的帮助。图聚类作为数据分析中的关键技术,可以对无标签的样本进行分类,大大地减少了标记成本,而且模型简单,可以很好地对大量的用户进行分类,筛选出有价值的用户。然而目前大多数的聚类方法最终都依赖传统的K-means方法,因为拉普拉斯矩阵划分规则不能保证最后的结果,需要借助K-means完成最终分类。而K-means聚类方法需要随机选择初始聚类中心,围绕所选的聚类中心进行不断迭代,完成聚类,具有很大的随机性,不稳定性,而且该方法对样本中的异常值格外敏感,而在实际情况中,异常值是普遍存在的,这都将严重的影响聚类的精度。尽管很多方法对K-means提出了优化,如二分K-means,K-means++等等,然而这些方法又带来了新的参数和计算问题,使得聚类的精度和性能依旧没有很大的提升,无法快速对用户进行精准分类。
技术实现思路
本专利技术实施例的主要目的在于提供一种用户分类方法及系统,以快速精准地对用户进行分类,从而针对各类用户提供个性化服务,提高用户体验和用户粘性。为了实现上述目的,本专利技术实施例提供一种用户分类方法,包括:获取用户数量、用户分类数量和用户特征;根据用户特征构造约束矩阵;根据用户数量和用户分类数量确定秩约束条件;判断约束矩阵是否满足秩约束条件,根据判断结果对用户进行分类。本专利技术实施例还提供一种用户分类系统,包括:获取单元,用于获取用户数量、用户分类数量和用户特征;约束矩阵构造单元,用于根据用户特征构造约束矩阵;秩约束条件确定单元,用于根据用户数量和用户分类数量确定秩约束条件;用户分类单元,用于判断约束矩阵是否满足秩约束条件,根据判断结果对用户进行分类。本专利技术实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并在处理器上运行的计算机程序,处理器执行计算机程序时实现所述的用户分类方法的步骤。本专利技术实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现所述的用户分类方法的步骤。本专利技术实施例的用户分类方法及系统先根据用户特征构造约束矩阵,再根据用户数量和用户分类数量确定秩约束条件,然后判断约束矩阵是否满足秩约束条件,根据判断结果对用户进行分类,可以快速精准地对用户进行分类,从而针对各类用户提供个性化服务,提高用户体验和用户粘性。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例中用户分类方法的流程图;图2是S103的流程图;图3是S201的流程图;图4是本专利技术另一实施例中用户分类方法的流程图。图5是本专利技术实施例中相似度矩阵对应的相似图;图6是本专利技术实施例中用户分类系统的结构框图;图7是本专利技术实施例中计算机设备的结构框图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本领域技术人员知道,本专利技术的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。鉴于现有技术无法快速对用户进行精准分类,本专利技术实施例提供一种用户分类方法,其属于图聚类方法,通过引用拉普拉斯秩约束的方法改进相似图的划分规则,使其可以更精准的划分,避免后续K-means的处理,减少来自K-means方法带来的不准确性。传统的相似性度量一般采用统一的规则,利用欧式距离的反比函数来计算相似度,本专利技术采用自适应近邻方法,即采取就近分配的原则,距离越近分配的相似度就越大;将距离从大到小排列,取前k个数据作为近邻,使得物体之间的相似度更加准确,削弱来自外界的影响,可以提高聚类的精度和性能,更精准、更有效的对银行的大量用户进行分类,进而针对不同类别的用户采取不同的营销策略,实现精准营销,提高用户的满意度、用户体验和用户粘性,从而提高忠实用户的转化率。以下结合附图对本专利技术进行详细说明。图1是本专利技术实施例中用户分类方法的流程图。图4是本专利技术另一实施例中用户分类方法的流程图。如图1和图4所示,用户分类方法包括:S101:获取用户数量、用户分类数量和用户特征。具体实施时,可以从用户的外在属性、内在属性和消费属性中选择年龄、地区、职业、收入、教育程度、喜好、消费情况、交易频度和交易金额等作为用户特征。S102:根据所述用户特征构造约束矩阵。图2是S102的流程图。如图2所示,S102包括:S201:根据用户特征构造分类输入矩阵。具体实施时,对用户的每个特征进行量化。设共有n个用户,每个用户选取m个特征,量化结束后可以得到m×n维的矩阵,作为聚类的分类输入矩阵X。S202:根据分类输入矩阵、正则化参数和初始相似度矩阵确定相似度目标函数。图3是S202的流程图。如图3所示,S202包括:S301:根据分类输入矩阵确定初始噪声矩阵和初始干净数据矩阵。S302:根据初始噪声矩阵、初始干净数据矩阵和稀疏系数确定噪声分离目标函数。当量化的标准不准确时会对分类结果造成影响,为此首先对分类输入矩阵X进行降维处理,分离噪声,涉及的具体公式如下:其中,||U||*+α||E||1为噪声分离目标函数,U为m×n维不含噪声的初始干净数据矩阵,E为初始噪声矩阵,α为稀疏系数,可以使噪声矩阵E更加稀疏。S303:确定噪声分离目标函数的最小值对应的初始干净数据矩阵为干净数据矩阵。具体实施时,通过求解上述公式可以将量化带来的噪声矩阵分离,||U||*+α||E||1的最优值(最小值)对应的U即为干净数据矩阵。S304:根据干净数据矩阵、正则化参数和初始相似度矩阵确定相似度目标函数。具体实施时,可以利用自适应的方法构造相似度矩阵,确定相似度目标函数涉及的具体公式如下:其中,为相似度目标函数,ui为干净数据矩阵U的第i列,uj为干净数据矩阵U的第j列,sij本文档来自技高网...
【技术保护点】
1.一种用户分类方法,其特征在于,包括:/n获取用户数量、用户分类数量和用户特征;/n根据所述用户特征构造约束矩阵;/n根据所述用户数量和所述用户分类数量确定秩约束条件;/n判断所述约束矩阵是否满足秩约束条件,根据判断结果对所述用户进行分类。/n
【技术特征摘要】
1.一种用户分类方法,其特征在于,包括:
获取用户数量、用户分类数量和用户特征;
根据所述用户特征构造约束矩阵;
根据所述用户数量和所述用户分类数量确定秩约束条件;
判断所述约束矩阵是否满足秩约束条件,根据判断结果对所述用户进行分类。
2.根据权利要求1所述的用户分类方法,其特征在于,所述根据所述用户特征构造约束矩阵,包括:
根据所述用户特征构造分类输入矩阵;
根据所述分类输入矩阵、正则化参数和初始相似度矩阵确定相似度目标函数;
确定所述相似度目标函数的最小值对应的初始相似度矩阵为相似度矩阵;
根据所述相似度矩阵确定度矩阵;
确定所述度矩阵与所述相似度矩阵的差值为约束矩阵。
3.根据权利要求2所述的用户分类方法,其特征在于,判断所述约束矩阵是否满足秩约束条件,根据判断结果对所述用户进行分类包括:
判断所述约束矩阵的秩是否等于所述用户数量与所述用户分类数量的差值;
当所述约束矩阵的秩等于所述用户数量与所述用户分类数量的差值时,根据所述相似度矩阵对所述用户进行分类。
4.根据权利要求2所述的用户分类方法,其特征在于,根据所述分类输入矩阵、正则化参数和初始相似度矩阵确定相似度目标函数包括:
根据所述分类输入矩阵确定初始噪声矩阵和初始干净数据矩阵;
根据所述初始噪声矩阵、所述初始干净数据矩阵和稀疏系数确定噪声分离目标函数;
确定所述噪声分离目标函数的最小值对应的初始干净数据矩阵为干净数据矩阵;
根据所述干净数据矩阵、正则化参数和初始相似度矩阵确定相似度目标函数。
5.一种用户分类系统,其特征在于,包括:
获取单元,用于获取用户数量、用户分类数量和用户特征;
约束矩阵构造单元,用于根据所述用户特征构造约束矩阵;...
【专利技术属性】
技术研发人员:史晓东,白杰,王涛,施耀一,
申请(专利权)人:中国工商银行股份有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。