针对用户群的指标值差异或异常的解释方法和装置制造方法及图纸

技术编号:35306395 阅读:16 留言:0更新日期:2022-10-22 12:56
本说明书实施例提供一种针对用户群的指标值差异或异常的解释方法和装置,方法包括:获取历史用户群的用户信息;包括分别对应于m个维度特征的m个特征值及历史业务行为数据;历史业务行为数据与预设的业务指标相关;历史用户群包括预先按照业务指标划分的正常用户群和异常用户群;将历史用户群划分为n个子用户群,每个子用户群对应于一个特征值分箱组合;以最小化历史用户群中落入根因分箱组合的根因子用户群的用户数之和为目标,在预定约束条件下,确定各个特征值分箱组合是否为根因分箱组合;其中预定约束条件包括,去掉根因子用户群之后正常用户群的业务指标的第一指标值与异常用户群的第二指标值的差异小于预设正数。准确性高。准确性高。准确性高。

【技术实现步骤摘要】
针对用户群的指标值差异或异常的解释方法和装置


[0001]本说明书一个或多个实施例涉及计算机领域,尤其涉及针对用户群的指标值差异或异常的解释方法和装置。

技术介绍

[0002]在各种业务场景中,可以基于用户群在一段时间内的业务行为数据,来计算预设的业务指标的指标值,该指标值可以用于衡量该用户群为正常用户群还是异常用户群。通常地,异常用户群和正常用户群的指标值差异较大,例如,异常用户群的指标值相对于正常用户群的指标值异常偏高。需要针对用户群的指标值差异或异常作出解释,或者说,识别出上述指标值差异或异常的根本原因。
[0003]用户通常具有分别对应于多个维度特征的多个特征值,上述根本原因就是寻求导致上述指标值差异或异常的各个维度特征的特征取值。
[0004]现有技术中,针对用户群的指标值差异或异常的解释方法,准确性低。

技术实现思路

[0005]本说明书一个或多个实施例描述了一种针对用户群的指标值差异或异常的解释方法和装置,准确性高。
[0006]第一方面,提供了一种针对用户群的指标值差异的解释方法,方法包括:
[0007]获取历史用户群的用户信息;所述用户信息包括分别对应于m个维度特征的m个特征值以及历史业务行为数据;所述历史业务行为数据与预设的业务指标相关;所述历史用户群包括预先按照所述业务指标划分的正常用户群和异常用户群;
[0008]根据所述历史用户群中各个用户的m个特征值分别在针对各维度特征预设的特征值分箱中所归属的目标分箱,将所述历史用户群划分为n个子用户群,每个子用户群对应于一个特征值分箱组合;
[0009]以最小化所述历史用户群中落入根因分箱组合的根因子用户群的用户数之和为目标,在预定约束条件下,确定各个特征值分箱组合是否为根因分箱组合;其中所述预定约束条件包括,去掉所述根因子用户群之后所述正常用户群的所述业务指标的第一指标值与所述异常用户群的第二指标值的差异小于预设正数;所述根因分箱组合用于解释所述正常用户群和所述异常用户群在所述业务指标上的差异。
[0010]在一种可能的实施方式中,所述预定约束条件还包括:
[0011]所述第一指标值小于或等于预设阈值;和/或,
[0012]所述第二指标值小于或等于所述预设阈值。
[0013]在一种可能的实施方式中,所述正常用户群对应于所述业务指标的原始指标值小于预设阈值;所述异常用户群对应于所述业务指标的原始指标值大于预设阈值。
[0014]在一种可能的实施方式中,所述正常用户群和所述异常用户群由相同的用户组成,且对应于不同的时间周期。
[0015]在一种可能的实施方式中,所述正常用户群和所述异常用户群属于不同机构的用户群,且对应于相同的时间周期。
[0016]在一种可能的实施方式中,所述子用户群是用户数大于第一数量的用户群。
[0017]在一种可能的实施方式中,所述历史业务行为数据包括:
[0018]消费信贷业务的支用金额和不良金额;
[0019]所述业务指标包括:
[0020]金额不良率。
[0021]进一步地,所述业务指标的指标值通过如下方式确定:
[0022]计算用户群中各个用户的不良金额之和,得到总不良金额;
[0023]计算用户群中各个用户的支用金额之和,得到总支用金额;
[0024]总不良金额除以总支用金额,得到该用户群的金额不良率。
[0025]在一种可能的实施方式中,所述确定各个特征值分箱组合是否为根因分箱组合,包括:
[0026]定义n个整数变量代表n个特征值分箱组合是否为根因分箱组合,每个整数变量的取值为0或1,通过求解整数规划问题,得到各个特征值分箱组合是否为根因分箱组合的结果。
[0027]第二方面,提供了一种针对用户群的指标值异常的解释方法,方法包括:
[0028]获取历史用户群的用户信息;所述用户信息包括分别对应于m个维度特征的m个特征值以及历史业务行为数据;所述历史业务行为数据与预设的业务指标相关;所述历史用户群为预先按照所述业务指标确定的异常用户群;
[0029]根据所述历史用户群中各个用户的m个特征值分别在针对各维度特征预设的特征值分箱中所归属的目标分箱,将所述历史用户群划分为n个子用户群,每个子用户群对应于一个特征值分箱组合;
[0030]以最小化所述历史用户群中落入根因分箱组合的根因子用户群的用户数之和为目标,在预定约束条件下,确定各个特征值分箱组合是否为根因分箱组合;其中所述预定约束条件包括,去掉所述根因子用户群之后所述历史用户群的所述业务指标的第一指标值小于预设阈值;所述根因分箱组合用于解释所述异常用户群在所述业务指标上的原始指标值异常偏高的原因。
[0031]第三方面,提供了一种针对用户群的指标值差异的解释装置,装置包括:
[0032]获取单元,用于获取历史用户群的用户信息;所述用户信息包括分别对应于m个维度特征的m个特征值以及历史业务行为数据;所述历史业务行为数据与预设的业务指标相关;所述历史用户群包括预先按照所述业务指标划分的正常用户群和异常用户群;
[0033]划分单元,用于根据所述获取单元获取的历史用户群中各个用户的m个特征值分别在针对各维度特征预设的特征值分箱中所归属的目标分箱,将所述历史用户群划分为n个子用户群,每个子用户群对应于一个特征值分箱组合;
[0034]确定单元,用于以最小化所述历史用户群中落入所述划分单元划分的根因分箱组合的根因子用户群的用户数之和为目标,在预定约束条件下,确定各个特征值分箱组合是否为根因分箱组合;其中所述预定约束条件包括,去掉所述根因子用户群之后所述正常用户群的所述业务指标的第一指标值与所述异常用户群的第二指标值的差异小于预设正数;
所述根因分箱组合用于解释所述正常用户群和所述异常用户群在所述业务指标上的差异。
[0035]第四方面,提供了一种针对用户群的指标值异常的解释装置,装置包括:
[0036]获取单元,用于获取历史用户群的用户信息;所述用户信息包括分别对应于m个维度特征的m个特征值以及历史业务行为数据;所述历史业务行为数据与预设的业务指标相关;所述历史用户群为预先按照所述业务指标确定的异常用户群;
[0037]划分单元,用于根据所述获取单元获取的历史用户群中各个用户的m个特征值分别在针对各维度特征预设的特征值分箱中所归属的目标分箱,将所述历史用户群划分为n个子用户群,每个子用户群对应于一个特征值分箱组合;
[0038]确定单元,用于以最小化所述历史用户群中落入所述划分单元划分的根因分箱组合的根因子用户群的用户数之和为目标,在预定约束条件下,确定各个特征值分箱组合是否为根因分箱组合;其中所述预定约束条件包括,去掉所述根因子用户群之后所述历史用户群的所述业务指标的第一指标值小于预设阈值;所述根因分箱组合用于解释所述异常用户群在所述业务指标上的原始指标值异常偏高的原因。
[0039]第五方面,提供了一种本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种针对用户群的指标值差异的解释方法,所述方法包括:获取历史用户群的用户信息;所述用户信息包括分别对应于m个维度特征的m个特征值以及历史业务行为数据;所述历史业务行为数据与预设的业务指标相关;所述历史用户群包括预先按照所述业务指标划分的正常用户群和异常用户群;根据所述历史用户群中各个用户的m个特征值分别在针对各维度特征预设的特征值分箱中所归属的目标分箱,将所述历史用户群划分为n个子用户群,每个子用户群对应于一个特征值分箱组合;以最小化所述历史用户群中落入根因分箱组合的根因子用户群的用户数之和为目标,在预定约束条件下,确定各个特征值分箱组合是否为根因分箱组合;其中所述预定约束条件包括,去掉所述根因子用户群之后所述正常用户群的所述业务指标的第一指标值与所述异常用户群的第二指标值的差异小于预设正数;所述根因分箱组合用于解释所述正常用户群和所述异常用户群在所述业务指标上的差异。2.如权利要求1所述的方法,其中,所述预定约束条件还包括:所述第一指标值小于或等于预设阈值;和/或,所述第二指标值小于或等于所述预设阈值。3.如权利要求1所述的方法,其中,所述正常用户群对应于所述业务指标的原始指标值小于预设阈值;所述异常用户群对应于所述业务指标的原始指标值大于预设阈值。4.如权利要求1所述的方法,其中,所述正常用户群和所述异常用户群由相同的用户组成,且对应于不同的时间周期。5.如权利要求1所述的方法,其中,所述正常用户群和所述异常用户群属于不同机构的用户群,且对应于相同的时间周期。6.如权利要求1所述的方法,其中,所述子用户群是用户数大于第一数量的用户群。7.如权利要求1所述的方法,其中,所述历史业务行为数据包括:消费信贷业务的支用金额和不良金额;所述业务指标包括:金额不良率。8.如权利要求7所述的方法,其中,所述业务指标的指标值通过如下方式确定:计算用户群中各个用户的不良金额之和,得到总不良金额;计算用户群中各个用户的支用金额之和,得到总支用金额;总不良金额除以总支用金额,得到该用户群的金额不良率。9.如权利要求1所述的方法,其中,所述确定各个特征值分箱组合是否为根因分箱组合,包括:定义n个整数变量代表n个特征值分箱组合是否为根因分箱组合,每个整数变量的取值为0或1,通过求解整数规划问题,得到各个特征值分箱组合是否为根因分箱组合的结果。10.一种针对用户群的指标值异常的解释方法,所述方法包括:获取历史用户群的用户信息;所述用户信息包括分别对应于m个维度特征的m个特征值以及历史业务行为数据;所述历史业务行为数据与预设的业务指标相关;所述历史用户群为预先按照所述业务指标确定的异常用户群;根据所述历史用户群中各个用户的m个特征值分别在针对各维度特征预设的特征值分
箱中所归属的目标分箱,将所述历史用户群划分为n个子用户群,每个子用户群对应于一个特征值分箱组合;以最小化所述历史用户群中落入根因分箱组合的根因子用户群的用户数之和为目标,在预定约束条件下,确定各个特征值分箱组合是否为根因分箱组合;其中所述预定约束条件包括,去掉所述根因子用户群之后所述历史用户群的所述业务指标的第一指标值小于预设阈值;所述根因分箱组合用于解释所述异常用户群在所述业务指标上的原始指标值异常偏高的原因。11.一种针对用户群的指标值差异的解释装置,所述装置包括:获取单元,用于获取历史用户群的用户信息;所述用户信息包括分别对应于m个维度特征的m个特征值以及历史业务行为数据;所述历史业务行为数据与预设的业务指标相关;所述历史用户群包括预先按照所述业务指标...

【专利技术属性】
技术研发人员:殷旭东吴云崇章鹏
申请(专利权)人:蚂蚁区块链科技上海有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1