【技术实现步骤摘要】
一种分群处理方法及装置
[0001]本专利技术涉及数据处理领域,具体而言,涉及一种分群处理方法及装置。
技术介绍
[0002]聚类算法可以实现对客户进行分群的目的,但由于其为无监督算法,采取此算法获得的客户分群一是容易缺乏解释性,难以描述每个客群的特征,二是无法满足分群后,对不同客群建模提升整体模型精度的需求,极有可能造成无监督聚类得到的分群,分群建模后反而使整体模型效果下降。
[0003]决策树算法是一种有监督学习算法,得到的分群直观可解释,但采用此算法需要预先获得一批带有分群标签的样本,而在探索分群建模这一问题上,建模人员并没有“准确”的分群标签样本,无法直接使用此算法解决目标问题。
[0004]在样本没有已知分群标记的情况下,通常会使用无监督算法将数据集分成一个个簇(可理解为一个个小组),从而实现客户的分群,但无监督聚类的算法也会带来上述问题,无法根本性满足目标需求。
[0005]针对相关技术中在样本没有已知分群标记的情况下,使用无监督算法进行分群无法根本性满足目标需求的问题,尚未提出解决方案。 ...
【技术保护点】
【技术特征摘要】
1.一种分群处理方法,其特征在于,包括:获取训练样本的分群特征;根据所述分群特征的分群节点对所述训练样本进行分群建模;根据建立的分群模型与基于所述训练样本建立的全样本基准模型进行分群处理。2.根据权利要求1所述的方法,其特征在于,根据所述分群特征的分群节点对所述训练样本进行分群建模包括:根据所述训练样本或分群的每个分群特征的每个分群节点对所述训练样本进行分群,得到多组分群,其中,每组分群包括两个分群;分别对每组分群进行建模,得到每组分群对应的多组分群模型,其中,每组分群模型包括两个分群模型。3.根据权利要求2所述的方法,其特征在于,根据建立的分群模型与基于所述训练样本建立的全样本基准模型进行分群处理包括:将每组分群模型进行融合,得到多个融合模型;从所述多个融合模型中选取最优融合模型;根据所述最优融合模型与所述全样本基准模型进行分群处理。4.根据权利要求3所述的方法,其特征在于,从所述多个融合模型中选取最优融合模型包括:分别确定所述多个融合模型的预测效果值;从每个分群特征对应的多个融合模型中选取每个分群特征对应的预测效果值最大的目标融合模型;从所有分群特征对应的多个目标融合模型中选取所述预测效果值最大的所述最优融合模型。5.根据权利要求4所述的方法,其特征在于,所述方法还包括:将所述最优融合模型对应的分群节点确定为目标分群节点;在分群树上为对应的分群设置包括所述目标分群节点的分群条件。6.根据权利要求3所述的方法,其特征在于,根据所述最优融合模型与所述全样本基准模型进行分群处理包括:将所述融合模型的模型评价指标与所述全样本基准模型的模型评价指标进行对比;若所述融合模型的模型评价指标与所述全样本基准模型的模型评价指标的差值大于第一预设阈值,判断所述分群树的当前深度是否大于第二预设阈值;若所述融合模型的模型评价指...
【专利技术属性】
技术研发人员:黄佳玥,
申请(专利权)人:兴业消费金融股份公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。