一种用户样本聚类方法及相关设备技术

技术编号:45840305 阅读:21 留言:0更新日期:2025-07-15 22:48
本说明书实施例公开了一种用户样本聚类方法及相关设备,涉及聚类处理技术领域。针对需要聚类处理的大量用户样本以得到多个类,根据多个用户样本对应的数量和特征信息,确定约束条件和初始类别数,初始类别数表征作为聚类结果的多个类的数量,约束条件为各类包括的多个用户样本的数量大于下界值且小于上界值。进一步地,对多个用户样本进行至少一次聚类处理,直至目标聚类结果满足预期时得到多个目标类,多个目标类的数量为目标类别数,且各目标类均满足约束条件。通过本说明书提出的用户样本聚类方法,可以更好地对使用了相同产品服务的多个用户进行聚类得到至少一个目标类,从而为目标类中多个用户提供产品包括的与目标类匹配的个性化服务。

【技术实现步骤摘要】

本说明书涉及聚类处理,尤其涉及一种用户样本聚类方法及相关设备


技术介绍

1、聚类分析广泛应用于各领域,如图像压缩、文本分类、社交领域分析、用户分群等,是一种强大的无监督学习技术,可以发现数据中的潜在结构和模式。

2、信贷产品在用户资金流动性不足的情况下能够满足用户的消费需求和资金需求。准确预测用户未来的借款需求和还款能够帮助提供借贷服务的服务方更好地管理资金,减少服务方资产的流动性风险。在大量的用户群体中,相似群体具有接近的支用、还款等行为模式。将用户进行聚类可以更好地根据不同类用户的历史行为对未来的支用、还款等行为模式进行预测,提升预测准确率。

3、常见的聚类算法如k-means或层次聚类。k-means聚类方法对样本汇中离群点较为敏感,异常值可能会影响聚类结果,构建出不准确的用户画像作为聚类结果。层次聚类以树状结构图展示聚类结果,对于大数据集,计算复杂度较高。

4、更加复杂的聚类方法如dbscan解决了离群点问题,但不合适的参数设置(邻域半径和最小样本点数)会影响聚类效果,可能导致“维度诅咒”问题。

5本文档来自技高网...

【技术保护点】

1.一种用户样本聚类方法,其特征在于,所述方法包括:

2.根据权利要求1所述的用户样本聚类方法,其特征在于,所述根据所述初始类别数和所述约束条件,对所述多个用户样本进行至少一次聚类处理,直至目标聚类结果满足预期时得到多个目标类,包括:

3.根据权利要求2所述的用户样本聚类方法,其特征在于,所述将所述过小类与所述第一聚类结果中满足合并条件的类进行合并处理,得到合并类,包括:

4.根据权利要求1所述的用户样本聚类方法,其特征在于,所述根据所述初始类别数和所述约束条件,对所述多个用户样本进行至少一次聚类处理,直至目标聚类结果满足预期时得到多个目标类,包括:<...

【技术特征摘要】

1.一种用户样本聚类方法,其特征在于,所述方法包括:

2.根据权利要求1所述的用户样本聚类方法,其特征在于,所述根据所述初始类别数和所述约束条件,对所述多个用户样本进行至少一次聚类处理,直至目标聚类结果满足预期时得到多个目标类,包括:

3.根据权利要求2所述的用户样本聚类方法,其特征在于,所述将所述过小类与所述第一聚类结果中满足合并条件的类进行合并处理,得到合并类,包括:

4.根据权利要求1所述的用户样本聚类方法,其特征在于,所述根据所述初始类别数和所述约束条件,对所述多个用户样本进行至少一次聚类处理,直至目标聚类结果满足预期时得到多个目标类,包括:

5.根据权利要求4所述的用户样本聚类方法,其特征在于,所述根据所述第一拆分类别数对所述过大类包括的多个用户样本进行拆分处理,得到多个第一拆分类,包括:

6.根据权利要求4所述的用户样本聚类方法,其特征在于,所述检测所述多个第一拆分类是否均满足所述约束条件,以及包括所述多个第一拆分类的第四聚类结果是否满足预期之后,还包括:

7.根据权利要求6所述的用户...

【专利技术属性】
技术研发人员:汪世川伍舒妮周云逸刘义
申请(专利权)人:重庆蚂蚁消费金融有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1