一种对象聚类方法及相关装置制造方法及图纸

技术编号:36840428 阅读:28 留言:0更新日期:2023-03-15 15:33
本申请公开一种对象聚类方法及相关装置,根据获取的待处理对象的基本属性信息和资源值转移数据,确定待处理对象的第一特征向量。通过目标自编码器对第一特征向量进行降维处理,将其映射到二维空间得到第二特征向量,将隐藏差异进行了有效区分。这样根据第二特征向量在二维空间的分布情况对待处理对象进行聚类,将分布紧密程度达到预设阈值的第二特征向量所表征的待处理对象划分至对应的对象聚集群体,每个对象聚集群体具有对应的质量等级,从而知晓待处理对象的质量等级,为后续额度策略及利率制定方案提供重要依据。本申请聚类所依据的信息更加丰富全面,并对隐藏差异进行有效区分,提高了聚类结果的准确性,更加准确地区分不同对象的质量等级。区分不同对象的质量等级。区分不同对象的质量等级。

【技术实现步骤摘要】
一种对象聚类方法及相关装置


[0001]本申请涉及数据处理领域,特别是涉及一种对象聚类方法及相关装置。

技术介绍

[0002]随着互联网金融的发展,越来越多的可以使得客户提前消费的信贷业务不断涌现,而在信贷业务中,客户(包括个人和集体,集体例如可以是公司、机构等)的质量直接决定了银行等金融机构所要承担的金融风险的大小。因此,需要对客户质量进行有效区分,从而为后续信贷业务中的额度策略及利率制定方案提供重要依据。
[0003]目前,一般是通过性别、年龄、学历、收入等基础信息,对客户进行聚类。以按照收入对客户(例如个人)进行聚类为例,收入为5000以下的客户划分至同一客群,收入为5000

15000的客户划分至同一客群,收入为15000

30000的客户划分至同一客群,收入为30000以上的客户划分至同一客群。
[0004]然而这种方法聚类依据过于片面,导致聚类结果不够准确,进而无法准确的区分客户质量。

技术实现思路

[0005]为了解决上述技术问题,本申请提供了一种对象聚类方法及相关装置,聚类所依据的信息更加丰富、全面,并且可以通过降维处理对隐藏差异进行有效区分,挖掘待处理对象更深层次的特征,从而依据第二特征向量在二维空间的分布情况对待处理对象进行聚类,提高了聚类结果的准确性,更加准确地区分不同对象的质量等级。
[0006]本申请实施例公开了如下技术方案:
[0007]一方面,本申请实施例提供一种对象聚类方法,所述方法包括:
[0008]获取待处理对象的基本属性信息和资源值转移数据;
[0009]根据所述待处理对象的基本属性信息和资源值转移数据,确定所述待处理对象的第一特征向量;
[0010]通过目标自编码器对所述第一特征向量进行降维处理,将所述第一特征向量映射到二维空间得到第二特征向量;
[0011]根据所述第二特征向量在所述二维空间的分布情况对所述待处理对象进行聚类,将分布紧密程度达到预设阈值的第二特征向量所表征的待处理对象划分至对应的对象聚集群体,所述分布情况包括所述分布紧密程度,所述对象聚集群体具有对应的质量等级。
[0012]一方面,本申请实施例提供一种对象聚类装置,所述装置包括获取单元、确定单元、降维单元和聚类单元:
[0013]所述获取单元,用于获取待处理对象的基本属性信息和资源值转移数据;
[0014]所述确定单元,用于根据所述待处理对象的基本属性信息和资源值转移数据,确定所述待处理对象的第一特征向量;
[0015]所述降维单元,用于通过目标自编码器对所述第一特征向量进行降维处理,将所
述第一特征向量映射到二维空间得到第二特征向量;
[0016]所述聚类单元,用于根据所述第二特征向量在所述二维空间的分布情况对所述待处理对象进行聚类,将分布紧密程度达到预设阈值的第二特征向量所表征的待处理对象划分至对应的对象聚集群体,所述分布情况包括所述分布紧密程度,所述对象聚集群体具有对应的质量等级。
[0017]在一种可能的实现方式中,所述确定单元,用于:
[0018]根据所述待处理对象的基本属性信息和资源值转移数据,确定所述待处理对象的第三特征向量;
[0019]确定所述第三特征向量中每个维度的特征向量的信息量值;
[0020]若确定目标维度的特征向量的信息量值达到预设阈值,从所述第三特征向量中筛选所述目标维度的特征向量作为所述第一特征向量。
[0021]在一种可能的实现方式中,所述确定单元,用于:
[0022]从所述待处理对象的基本属性信息和资源值转移数据提取出所述待处理对象的第四特征向量;
[0023]对所述第四特征向量进行不同时间窗口的切分,并对切分后位于目标时间窗口的第四特征向量进行特征衍生,得到所述第三特征向量,所述第三特征向量的维度高于所述第四特征向量的维度。
[0024]在一种可能的实现方式中,所述装置还包括训练单元:
[0025]所述训练单元,用于获取样本对象的基本属性信息和资源值转移数据;
[0026]根据所述样本对象的基本属性信息和资源值转移数据,确定所述样本对象的第一样本特征向量;
[0027]通过待训练自编码器对所述第一样本特征向量进行降维处理,将所述第一样本特征向量映射到二维空间输出第二样本特征向量;
[0028]根据所述第二样本特征向量和所述第一样本特征向量计算目标损失函数;
[0029]依据所述目标损失函数对所述待训练自编码器进行训练得到所述目标自编码器。
[0030]在一种可能的实现方式中,所述训练单元,用于:
[0031]根据所述样本对象的基本属性信息和资源值转移数据,确定所述样本对象的第三样本特征向量;
[0032]确定所述第三样本特征向量中每个维度的特征向量的信息量值;
[0033]若确定目标维度的特征向量的信息量值达到预设阈值,从所述第三样本特征向量中筛选目标维度的特征向量作为所述第一样本特征向量。
[0034]在一种可能的实现方式中,所述训练单元,用于:
[0035]从所述样本对象的基本属性信息和资源值转移数据提取出所述样本对象的第四样本特征向量;
[0036]对所述第四样本特征向量进行不同时间窗口的切分,并对切分后位于目标时间窗口的第四样本特征向量进行特征衍生,得到所述第三样本特征向量,所述第三样本特征向量的维度高于所述第四样本特征向量的维度。
[0037]在一种可能的实现方式中,所述降维单元还用于:
[0038]通过所述目标自编码器对所述第一样本特征向量进行降维处理,将所述第一样本
特征向量映射到二维空间输出第二样本特征向量;
[0039]所述聚类单元还用于:
[0040]根据所述第二样本特征向量在所述二维空间的分布情况对所述样本对象进行聚类,将分布紧密程度达到预设阈值的第二样本特征向量所表征的待处理对象聚集到同一个对象聚集群体,得到聚类结果,所述聚类结果包括多个对象聚集群体。
[0041]在一种可能的实现方式中,所述装置还包括验证单元:
[0042]所述验证单元,用于通过每个对象聚集群体中样本对象的逾期率,对所述聚类结果进行验证;
[0043]所述确定单元,用于若验证通过,依据每个对象聚集群体中样本对象的逾期率,确定所述对象聚集群体的质量等级。
[0044]所述第二特征向量为二维特征向量,所述聚类单元,用于:
[0045]利用DBSCAN算法依据所述第二特征向量在所述二维空间的分布情况对所述待处理对象进行聚类,将分布紧密程度达到预设阈值的第二特征向量所表征的待处理对象划分至对应的对象聚集群体。
[0046]一方面,本申请实施例提供一种用于对象聚类的电子设备,所述电子设备包括处理器以及存储器:
[0047]所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
[0048]本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种对象聚类方法,其特征在于,所述方法包括:获取待处理对象的基本属性信息和资源值转移数据;根据所述待处理对象的基本属性信息和资源值转移数据,确定所述待处理对象的第一特征向量;通过目标自编码器对所述第一特征向量进行降维处理,将所述第一特征向量映射到二维空间得到第二特征向量;根据所述第二特征向量在所述二维空间的分布情况对所述待处理对象进行聚类,将分布紧密程度达到预设阈值的第二特征向量所表征的待处理对象划分至对应的对象聚集群体,所述分布情况包括所述分布紧密程度,所述对象聚集群体具有对应的质量等级。2.根据权利要求1所述的方法,其特征在于,所述根据所述待处理对象的基本属性信息和资源值转移数据,确定所述待处理对象的第一特征向量,包括:根据所述待处理对象的基本属性信息和资源值转移数据,确定所述待处理对象的第三特征向量;确定所述第三特征向量中每个维度的特征向量的信息量值;若确定目标维度的特征向量的信息量值达到预设阈值,从所述第三特征向量中筛选所述目标维度的特征向量作为所述第一特征向量。3.根据权利要求2所述的方法,其特征在于,所述根据所述待处理对象的基本属性信息和资源值转移数据,确定所述待处理对象的第三特征向量,包括:从所述待处理对象的基本属性信息和资源值转移数据提取出所述待处理对象的第四特征向量;对所述第四特征向量进行不同时间窗口的切分,并对切分后位于目标时间窗口的第四特征向量进行特征衍生,得到所述第三特征向量,所述第三特征向量的维度高于所述第四特征向量的维度。4.根据权利要求1所述的方法,其特征在于,所述目标自编码器的训练方式包括以下步骤:获取样本对象的基本属性信息和资源值转移数据;根据所述样本对象的基本属性信息和资源值转移数据,确定所述样本对象的第一样本特征向量;通过待训练自编码器对所述第一样本特征向量进行降维处理,将所述第一样本特征向量映射到二维空间输出第二样本特征向量;根据所述第二样本特征向量和所述第一样本特征向量计算目标损失函数;依据所述目标损失函数对所述待训练自编码器进行训练得到所述目标自编码器。5.根据权利要求4所述的方法,其特征在于,所述根据所述样本对象的基本属性信息和资源值转移数据,确定所述样本对象的第一样本特征向量,包括:根据所述样本对象的基本属性信息和资源值转移数据,确定所述样本对象的第三样本特征向量;确定所述第三样本特征向量中每个维度的特征向量的信息量值;若确定目标维度的特征向量的信息量值达到预设阈值,从所述第三样本特征向量中筛选目标维度的特征向量作为所述第一样本特征向量。
6.根据权利要求5所述的方法,其特征在于,根据所述样本对象的基本属性信息和资源值转移数据,确定所述样本对象的第三样本特征向量,包括:从所述样本对象的基本属性信息和资源值转移数据提取出所述样本对象的第四样本特征向量;对所述第四样本...

【专利技术属性】
技术研发人员:张瞳
申请(专利权)人:财付通支付科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1