脱保客户召回预测方法及装置制造方法及图纸

技术编号:39493172 阅读:11 留言:0更新日期:2023-11-24 11:18
本申请公开了一种脱保客户召回预测方法及装置

【技术实现步骤摘要】
脱保客户召回预测方法及装置、可读存储介质


[0001]本申请涉及人工智能算法领域,尤其涉及一种脱保客户召回预测方法及装置

可读存储介质


技术介绍

[0002]现有的脱保客户召回工作,通过人工形式筛选客户群体,对全部或圈定的一部分范围的客户,配合营销策略开展召回工作

在筛选客户群体时工作量较大,耗费大量人力物力成本,且筛选客户群体不能准确定位到理想客户群体,且在召回阶段,因不了解客户的意向,容易造成资源浪费

[0003]如何提高脱保客户召回的效率是目前需要解决的问题


技术实现思路

[0004]本申请实施例的目的是提供一种脱保客户召回预测方法及装置

可读存储介质,用以解决脱保客户召回效率低的问题

[0005]为了解决上述技术问题,本说明书是这样实现的:
[0006]第一方面,提供了一种脱保客户召回预测方法,包括:
[0007]基于历史脱保客户的数据特征,确定用来衡量脱保客户群体的价值和利益能力的多个指标特征;
[0008]基于所述多个指标特征的组合,对待召回脱保客户群体进行聚类处理,以得到不同聚类数量对应的聚类簇;
[0009]从不同聚类数量对应聚类簇中筛选最优聚类数量对应的聚类簇;
[0010]将所述目标聚类数量对应的聚类簇下各待召回脱保客户的数据特征分别输入预设的脱保客户召回模型,得到各待召回脱保客户对应的召回预测概率

[0011]可选地,基于历史脱保客户的数据特征,确定用来衡量脱保客户群体的价值和利益能力的多个指标特征,包括:
[0012]获取所述历史脱保客户的数据特征;
[0013]按照业务逻辑将获取的数据特征分类为消费能力

消费倾向

理赔脱保对应类别的数据特征;
[0014]对所述数据特征进行包括数据探查

数据清洗

空值处理

噪声
/
异常数据处理

特征衍生

特征选择

特征标准化中至少一项的预处理;
[0015]基于业务理解和
RFM
模型,从预处理后的数据特征中筛选出所述多个指标特征

[0016]可选地,所述多个指标特征包括持有保单数

累计保费

个人年收入和脱保时长

[0017]可选地,从不同聚类数量对应聚类簇中筛选最优聚类数量对应的聚类簇,包括:
[0018]分别确定各聚类数量对应的聚类簇中包括的各待召回脱保客户对应样本点的轮廓系数和同一聚类数量对应的各聚类簇中所有样本点的平均轮廓系数,一个待召回脱保客户对应一个样本点;
[0019]分别比对各聚类数量对应的聚类簇对应样本点的轮廓系数和所述平均轮廓系数;
[0020]基于比对结果和不同聚类数量对应的各聚类簇的样本点数量,从不同聚类数量对应聚类簇中筛选出所述最优聚类数量对应的聚类簇

[0021]可选地,从不同聚类数量对应聚类簇中筛选最优聚类数量对应的聚类簇之后,还包括:
[0022]可视化所述多个指标特征在所述最优聚类数量对应的各聚类簇上的分布,以确定各指标特征表现最优对应的聚类簇

[0023]可选地,将所述目标聚类数量对应的聚类簇下各待召回脱保客户的数据特征输入预设的脱保客户召回模型之前,还包括训练所述脱保客户召回模型的步骤,具体包括:
[0024]获取历史脱保客户的数据特征,所述历史脱保客户包括脱保已召回客户和脱保未召回客户;
[0025]从所述数据特征中筛选出预定数量与脱保召回相关的多个建模特征;
[0026]基于所述多个建模特征构建初始的脱保客户召回模型;
[0027]以各历史脱保客户的数据特征为样本

以脱保已召回客户为正标签

脱保未召回客户为负标签,训练所述初始的脱保客户召回模型,得到所述脱保客户召回模型

[0028]可选地,得到各待召回脱保客户对应的召回预测概率之后,还包括:
[0029]建立各待召回脱保客户与对应的召回预测概率之间的关联关系;
[0030]依次遍历所述多个建模特征中的所有
n
个建模特征,以确定各建模特征下对应所述各待召回脱保客户的整体召回预测概率最高的第一建模特征;
[0031]固定所述第一建模特征,依次遍历
n
‑1个建模特征,以确定双建模特征组合下对应所述各待召回脱保客户的整体召回预测概率最高的第二建模特征;
[0032]固定所述第一建模特征

所述第二建模特征,依次遍历
n
‑2个建模特征,直至循环遍历所有建模特征组合,得到各建模特征组合下对应所述各待召回脱保客户的整体召回预测概率;
[0033]基于上述遍历确定的建模特征,得到所述
n
个建模特征对应的待召回脱保客户的整体召回预测概率分布路径

[0034]可选地,获取历史脱保客户的数据特征之后,还包括:
[0035]通过决策树算法,依次将所述历史脱保客户在不同建模特征上进行二分类,以将脱保已召回客户和脱保未召回客户在不同建模特征空间进行划分;
[0036]直至目标叶节点上脱保已召回客户和脱保未召回客户的占比区分度最高时停止,得到目标决策树;
[0037]从所述目标决策树中确定脱保已召回客户占比最多的子树;
[0038]提取所述子树的决策路径作为规则,以用于制定对应的召回营销策略

[0039]第二方面,提供了一种脱保客户召回预测装置,包括:包括存储器和与所述存储器电连接的处理器,所述存储器存储有可在所述处理器运行的计算机程序,该计算机程序被该处理器执行时实现如第一方面所述的方法的步骤

[0040]第三方面,提供了一种可读存储介质,该可读存储介质上存储计算机程序,该计算机程序被处理器执行时实现如第一方面所述的方法的步骤

[0041]在本申请实施例中,通过基于历史脱保客户的数据特征,确定用来衡量脱保客户
群体的价值和利益能力的多个指标特征;基于所述多个指标特征的组合,对待召回脱保客户群体进行聚类处理,以得到不同聚类数量对应的聚类簇;从不同聚类数量对应聚类簇中筛选最优聚类数量对应的聚类簇;将所述目标聚类数量对应的聚类簇下各待召回脱保客户的数据特征分别输入预设的脱保客户召回模型,得到各待召回脱保客户对应的召回预测概率,由此,可以准确定位理想的待召回脱保客户群体,便于减少召回脱保客户群体时耗费的大量人力物力成本,并且通过脱保客户召回模型可以进一步对这些定位到的待召回脱保客户进行准确的召回概率预测,便于结合各待召回脱保客户对本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种脱保客户召回预测方法,其特征在于,包括:基于历史脱保客户的数据特征,确定用来衡量脱保客户群体的价值和利益能力的多个指标特征;基于所述多个指标特征的组合,对待召回脱保客户群体进行聚类处理,以得到不同聚类数量对应的聚类簇;从不同聚类数量对应聚类簇中筛选最优聚类数量对应的聚类簇;将所述目标聚类数量对应的聚类簇下各待召回脱保客户的数据特征分别输入预设的脱保客户召回模型,得到各待召回脱保客户对应的召回预测概率
。2.
如权利要求1所述的方法,其特征在于,基于历史脱保客户的数据特征,确定用来衡量脱保客户群体的价值和利益能力的多个指标特征,包括:获取所述历史脱保客户的数据特征;按照业务逻辑将获取的数据特征分类为消费能力

消费倾向

理赔脱保对应类别的数据特征;对所述数据特征进行包括数据探查

数据清洗

空值处理

噪声
/
异常数据处理

特征衍生

特征选择

特征标准化中至少一项的预处理;基于业务理解和
RFM
模型,从预处理后的数据特征中筛选出所述多个指标特征
。3.
如权利要求2所述的方法,其特征在于,所述多个指标特征包括持有保单数

累计保费

个人年收入和脱保时长
。4.
如权利要求1所述的方法,其特征在于,从不同聚类数量对应聚类簇中筛选最优聚类数量对应的聚类簇,包括:分别确定各聚类数量对应的聚类簇中包括的各待召回脱保客户对应样本点的轮廓系数和同一聚类数量对应的各聚类簇中所有样本点的平均轮廓系数,一个待召回脱保客户对应一个样本点;分别比对各聚类数量对应的聚类簇对应样本点的轮廓系数和所述平均轮廓系数;基于比对结果和不同聚类数量对应的各聚类簇的样本点数量,从不同聚类数量对应聚类簇中筛选出所述最优聚类数量对应的聚类簇
。5.
如权利要求1所述的方法,其特征在于,从不同聚类数量对应聚类簇中筛选最优聚类数量对应的聚类簇之后,还包括:可视化所述多个指标特征在所述最优聚类数量对应的各聚类簇上的分布,以确定各指标特征表现最优对应的聚类簇
。6.
如权利要求1所述的方法,其特征在于,将所述目标聚类数量对应的聚类簇下各待召回脱保客户的...

【专利技术属性】
技术研发人员:吕博庆杨国梁赵妤
申请(专利权)人:人保信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1