价值预测模型生成方法、装置及价值预测方法、装置制造方法及图纸

技术编号:23401339 阅读:22 留言:0更新日期:2020-02-22 13:28
一种价值预测模型生成方法、装置及价值预测方法、装置,包括:获取多个样本保险客户的样本保险信息;基于样本保险信息生成样本保险特征,并基于样本保险信息确定客户价值;将样本保险特征及客户价值作为训练样本集迭代训练预先构建的机器学习模型,生成用于预测保险客户价值的价值预测模型。由于采用了大量训练样本训练机器学习模型,因此生成的价值预测模型是一个稳定的模型,从而实现了后续保险客户价值的预测。

Generation method, device, value prediction method and device of value prediction model

【技术实现步骤摘要】
价值预测模型生成方法、装置及价值预测方法、装置
本文涉及机器学习技术,尤指一种价值预测模型生成方法、装置及价值预测方法、装置。
技术介绍
客户对保险公司经营的重要性不言而喻,实现对保险客户价值的预测,从而施行差异化的保险营销策略能够使得保险公司的资源利用合理化和利润最大化,进而提升保险公司的市场竞争力和市场份额。然而现有技术缺乏一种用于预测客户价值的模型。
技术实现思路
本申请提供了一种价值预测模型生成方法、装置及价值预测方法、装置,能够提供一个价值预测模型,从而实现后续保险客户价值的预测。本申请提供了一种价值预测模型生成方法,包括:获取多个样本保险客户的样本保险信息;基于所述样本保险信息生成样本保险特征,并基于所述样本保险信息确定客户价值;将所述样本保险特征及所述客户价值作为训练样本集迭代训练预先构建的机器学习模型,生成用于预测保险客户价值的价值预测模型。当所述样本保险特征包括:i年份样本保险特征,且所述客户价值包括:i年份客户价值,所述样本保险信息包括:从i-k年份至i+s年份样本保险信息;所述样本保险信息和所述样本保险特征的种类包括:日期类型、连续类型、离散类型以及序列号类型;用于生成所述i年份样本保险特征的样本保险信息包括:从i-k年份至i年份的样本保险信息;用于生成所述i年份客户价值的样本保险信息包括:从i-t年份至i+s年份的样本保险信息,其中,t小于等于k。所述基于所述样本保险信息生成样本保险特征,包括:针对每个样本保险客户,基于从i-k年份至i年份日期类型的样本保险信息生成i年份日期类型的样本保险特征;针对每个样本保险客户,基于从i-k年份至i年份连续类型的样本保险信息生成i年份连续类型的样本保险特征;针对每个样本保险客户,基于从i-k年份至i年份离散类型的样本保险信息生成i年份离散类型的样本保险特征;针对每个样本保险客户,基于从i-k年份至i年份序列号类型的样本保险信息生成i年份序列号类型的样本保险特征。所述基于从i-k年份至i年份日期类型的样本保险信息生成i年份日期类型的样本保险特征之后,还包括:将所述i年份日期类型的样本保险特征、所述i年份连续类型的样本保险特征、所述i年份离散类型的样本保险特征和所述i年份序列号类型的样本保险特征进行筛选,得到筛选后的样本保险特征作为所述i年份的样本保险特征。所述筛选过程包括:筛选掉方差小于预设阈值的样本保险特征;在经过筛选处理后的样本保险特征上建立随机森林模型,以得到每个样本保险特征的权重,筛选掉具有最小权重的样本保险特征,在经过新一次筛选处理后的样本保险特征上重新建立随机森林模型,以筛选掉具有最小权重的样本保险特征,直到样本保险特征的数量达到预设数量。所述基于从i-k年份至i年份日期类型的样本保险信息生成i年份日期类型的样本保险特征,包括:设定所述i年份的最后一天为目标日期;基于所述从i-k年份至i年份日期类型的样本保险信息和所述目标日期计算保险频率,作为所述i年份日期类型的样本保险特征。所述基于从i-k年份至i年份日期类型的样本保险信息和目标日期计算保险频率,包括:利用所述从i-k年份至i年份日期类型的样本保险信息减去所述所述目标日期,得到一系列保险天数;从所述保险天数中获取最大值、最小值和均值;对所述保险天数进行排序,计算相邻保险天数之间的间隔,并从获得的间隔中获取最大值、最小值和均值;将从保险天数中获得的最大值、最小值和均值以及从间隔中获得的最大值、最小值和均值作为所述保险频率。所述基于从i-k年份至i年份连续类型的样本保险信息生成i年份连续类型的样本保险特征,包括:计算所述从i-k年份至i年份连续类型的样本保险信息的最大值、最小值、均值和标准差,作为所述i年份连续类型的样本保险特征。所述基于从i-k年份至i年份离散类型的样本保险信息生成i年份离散类型的样本保险特征,包括:统计所述从i-k年份至i年份离散类型的样本保险信息中相同样本保险信息的相同次数,并获取相同次数最大的样本保险信息作为所述i年份离散类型的样本保险特征。所述基于从i-k年份至i年份序列号类型的样本保险信息生成i年份序列号类型的样本保险特征,包括:统计所述从i-k年份至i年份序列号类型的样本保险信息中样本保险信息的个数,作为所述i年份序列号类型的样本保险特征。所述日期类型的样本保险信息包括:投保日期、理赔日期。所述连续类型的样本保险信息包括:净保费、保险次数。所述离散类型的样本保险信息包括:投保渠道、投保人性别。所述序列号类型的样本保险信息包括:保单号、立案号。所述基于样本保险信息确定客户价值,包括:获取所有样本保险客户从i-t年份至i+s年份的保费和利润;计算所有样本保险客户从i-t年份至i+s年份的保费总和利润总和;对计算得到的保费总和和利润总和分别进行归一化处理;根据归一化处理后的保费总和、利润总和,以及预先设定的排序位置与客户价值的对应关系获取所述i年份的的客户价值。所述根据归一化处理后的保费总和、利润总和,以及预先设定的排序位置与客户价值的对应关系获取i年份的的客户价值,包括:对每个所述样本保险客户归一化处理后的保费总和以及利润总和进行相加,得到每个所述样本保险客户归一化处理后的保费利润总和;对所有样本保险客户归一化处理后的保费利润总和进行排序,得到排序后的保费利润总和;获取每个所述样本保险客户归一化处理后的保费利润总和在排序后的保费利润总和中的排序位置;根据每个所述样本保险客户的排序位置,并按照预先设定的排序位置与客户价值的对应关系获取所述i年份的客户价值。所述k=2。所述s=1。所述t=1。本申请还提供了一种价值预测方法,包括:获取待预测客户的目标保险信息;基于所述目标保险信息生成目标保险特征;将所述目标保险特征输入至如上述任一项所述的价值预测模型生成方法生成的价值预测模型中,得到所述待预测客户的客户价值。所述客户价值包括:j年份客户价值,所述目标保险信息包括:从j-k年份至j年份的目标保险信息,所述目标保险信息的种类包括:日期类型、连续类型、离散类型以及序列号类型。所述基于目标保险信息生成目标保险特征,包括:基于从j-k年份至j年份日期类型的标保险信息生成j年份日期类型的目标保险特征;基于从j-k年份至j年份连续类型的目标保险信息生成j年份连续类型的目标保险特征;基于从j-k年份至j年份离散类型的目标保险信息生成j年份离散类型的目标保险特征;基于从j-k年份至j年份序列号类型的目标保险信息生成j年份序列号类型的目标保险特征。所述基于从j-k年份至j年份序列号类型的目标保险信息生成j年份序列号类型的目标保险特征之后,还包括本文档来自技高网...

【技术保护点】
1.一种价值预测模型生成方法,其特征在于,包括:/n获取多个样本保险客户的样本保险信息;/n基于所述样本保险信息生成样本保险特征,并基于所述样本保险信息确定客户价值;/n将所述样本保险特征及所述客户价值作为训练样本集迭代训练预先构建的机器学习模型,生成用于预测保险客户价值的价值预测模型。/n

【技术特征摘要】
1.一种价值预测模型生成方法,其特征在于,包括:
获取多个样本保险客户的样本保险信息;
基于所述样本保险信息生成样本保险特征,并基于所述样本保险信息确定客户价值;
将所述样本保险特征及所述客户价值作为训练样本集迭代训练预先构建的机器学习模型,生成用于预测保险客户价值的价值预测模型。


2.根据权利要求1所述的方法,其特征在于,当所述样本保险特征包括:i年份样本保险特征,且所述客户价值包括:i年份客户价值,所述样本保险信息包括:从i-k年份至i+s年份样本保险信息;所述样本保险信息和所述样本保险特征的种类包括:日期类型、连续类型、离散类型以及序列号类型;
用于生成所述i年份样本保险特征的样本保险信息包括:从i-k年份至i年份的样本保险信息;用于生成所述i年份客户价值的样本保险信息包括:从i-t年份至i+s年份的样本保险信息,其中,t小于等于k。


3.根据权利要求2所述的方法,其特征在于,所述基于所述样本保险信息生成样本保险特征,包括:
针对每个样本保险客户,基于从i-k年份至i年份日期类型的样本保险信息生成i年份日期类型的样本保险特征;
针对每个样本保险客户,基于从i-k年份至i年份连续类型的样本保险信息生成i年份连续类型的样本保险特征;
针对每个样本保险客户,基于从i-k年份至i年份离散类型的样本保险信息生成i年份离散类型的样本保险特征;
针对每个样本保险客户,基于从i-k年份至i年份序列号类型的样本保险信息生成i年份序列号类型的样本保险特征。


4.根据权利要求3所述的方法,其特征在于,所述基于从i-k年份至i年份日期类型的样本保险信息生成i年份日期类型的样本保险特征之后,还包括:
将所述i年份日期类型的样本保险特征、所述i年份连续类型的样本保险特征、所述i年份离散类型的样本保险特征和所述i年份序列号类型的样本保险特征进行筛选,得到筛选后的样本保险特征作为所述i年份的样本保险特征。


5.根据权利要求4所述的方法,其特征在于,所述筛选过程包括:
筛选掉方差小于预设阈值的样本保险特征;
在经过筛选处理后的样本保险特征上建立随机森林模型,以得到每个样本保险特征的权重,筛选掉具有最小权重的样本保险特征,在经过新一次筛选处理后的样本保险特征上重新建立随机森林模型,以筛选掉具有最小权重的样本保险特征,直到样本保险特征的数量达到预设数量。


6.根据权利要求3所述的方法,其特征在于,所述基于从i-k年份至i年份日期类型的样本保险信息生成i年份日期类型的样本保险特征,包括:
设定所述i年份的最后一天为目标日期;
基于所述从i-k年份至i年份日期类型的样本保险信息和所述目标日期计算保险频率,作为所述i年份日期类型的样本保险特征。


7.根据权利要求6所述的方法,其特征在于,所述基于从i-k年份至i年份日期类型的样本保险保险信息和目标日期计算保险保险频率,包括:
利用所述从i-k年份至i年份日期类型的样本保险保险信息减去所述目标日期,得到一系列保险天数;
从所述保险天数中获取最大值、最小值和均值;
对所述保险天数进行排序,计算相邻保险天数之间的间隔,并从获得的间隔中获取最大值、最小值和均值;
将从保险天数中获得的最大值、最小值和均值以及从间隔中获得的最大值、最小值和均值作为所述保险频率。


8.根据权利要求3所述的方法,其特征在于,所述基于从i-k年份至i年份连续类型的样本保险信息生成i年份连续类型的样本保险特征,包括:
计算所述从i-k年份至i年份连续类型的样本保险信息的最大值、最小值、均值和标准差,作为所述i年份连续类型的样本保险特征。


9.根据权利要求3所述的方法,其特征在于,所述基于从i-k年份至i年份离散类型的样本保险信息生成i年份离散类型的样本保险特征,包括:
统计所述从i-k年份至i年份离散类型的样本保险信息中相同样本保险信息的相同次数,并获取相同次数最大的样本保险信息作为所述i年份离散类型的样本保险特征。


10.根据权利要求3所述的方法,其特征在于,所述基于从i-k年份至i年份序列号类型的样本保险信息生成i年份序列号类型的样本保险特征,包括:
统计所述从i-k年份至i年份序列号类型的样本保险信息中样本保险信息的个数,作为所述i年份序列号类型的样本保险特征。


11.根据权利要求3、6或7所述的方法,其特征在于,所述日期类型的样本保险信息包括:投保日期、理赔日期。


12.根据权利要求3或8所述的方法,其特征在于,所述连续类型的样本保险信息包括:净保费、保险次数。


13.根据权利要求3或9所述的方法,其特征在于,所述离散类型的样本保险信息包括:投保渠道、投保人性别。


14.根据权利要求3或10所述的方法,其特征在于,所述序列号类型的样本保险信息包括:保单号、立案号。


15.根据权利要求2所述的方法,其特征在于,所述基于样本保险信息确定客户价值,包括:
获取所有样本保险客户从i-t年份至i+s年份的保费和利润;
计算所有样本保险客户从i-t年份至i+s年份的保费总和利润总和;
对计算得到的保费总和和利润总和分别进行归一化处理;
根据归一化处理后的保费总和、利润总和,以及预先设定的排序位置与客户价值的对应关系获取所述i年份的的客户价值。


16.根据权利要求15所述的方法,其特征在于,所述根据归一化处理后的保费总和、利润总和,以及预先设定的排序位置与客户价值的对应关系获取i...

【专利技术属性】
技术研发人员:李倩兰袁灿于政
申请(专利权)人:北京明略软件系统有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1