数据预测方法、装置、设备及存储介质制造方法及图纸

技术编号:25524311 阅读:14 留言:0更新日期:2020-09-04 17:13
本发明专利技术实施例提供一种数据预测方法、装置、设备及存储介质,该方法包括:获取目标客户的特征数据,所述目标客户为待预测缺口保额的客户;根据所述目标客户的特征数据,通过第一目标模型,得到所述目标客户的多个第一目标收入值;根据所述目标历史收入值和所述目标客户的特征数据,通过第二目标模型,得到所述目标客户当前的预测收入值。本实施例提供的方法能够克服在保险领域现有技术针对客户的收入值预测精度较低的问题。

【技术实现步骤摘要】
数据预测方法、装置、设备及存储介质
本专利技术实施例涉及数据处理
,尤其涉及一种数据预测方法、装置、设备及存储介质。
技术介绍
随着技术的发展,现在对数据的预测方法各式各样,可以应用到不同的领域。因此,在不同的领域,对于数据预测均有着重要意义。例如,在保险行业,可以对保险客户的缺口保额预测(缺口保额或保费缺口是指客户每年需要配置在保险领域的资产额度),进一步地为客户提供优质服务。目前有运用线性回归的方法,基于客户信息中记录的缴纳的3-6个月保险费用,来预测保险客户未来时间可以缴纳的保险费用,进一步地预测出保险客户的缺口保额。但是,在保险领域现有技术针对客户的收入值预测精度较低。
技术实现思路
本专利技术实施例提供一种数据预测方法、装置、设备及存储介质,以克服在保险领域现有技术针对客户的收入值预测精度较低的问题。第一方面,本专利技术实施例提供一种数据预测方法,包括:获取目标客户的特征数据,所述目标客户为待预测缺口保额的客户;根据所述目标客户的特征数据,通过第一目标模型,得到所述目标客户的多个第一目标收入值,所述第一目标模型是根据多个历史客户中的每个历史客户的特征数据,对LightGBM模型训练得到的,所述多个第一目标收入值包括所述目标客户在多个预设历史时间段中的每个所述预设历史时间段对应的目标历史收入值;根据所述目标历史收入值和所述目标客户的特征数据,通过第二目标模型,得到所述目标客户当前的预测收入值,所述第二目标模型是以通过所述LightGBM模型得到的每个所述历史客户在每个所述历史时间段对应的多个第一历史收入值和每个所述历史客户的特征数据为训练样本,对LSTM模型训练得到的。可选地,在通过第一目标模型,得到所述目标客户的多个第一目标收入值之前,所述方法还包括:获取每个所述历史客户的特征数据,所述历史客户的特征数据包括:年龄、职业、民族、性别、学历、消费指标以及实际收入值;对所述年龄、职业、民族、性别、学历、消费指标以及实际收入值进行预处理,得到所述年龄、职业、民族、性别、学历、消费指标以及实际收入值分别对应的标签值,所述标签值用于表示所述特征数据的标识符;以每个所述历史客户对应的所述标签值为一个第一样本,形成第一训练集和第一验证集,所述第一训练集和所述第一验证集合并为全集且所述第一训练集和所述第一验证集无交集;根据所述第一训练集中的第一样本,对所述LightGBM模型进行训练,得到训练后的LightGBM模型;根据所述第一验证集中的第一样本,对所述训练后的LightGBM模型进行验证,得到所述第一验证集中的第一样本对应的待校验收入值;若所述第一验证集中的第一样本包含的所述实际收入值与所述第一验证集中的第一样本对应的待校验收入值之间的误差在第一预设误差范围内,则将所述训练后的LightGBM模型作为所述第一目标模型。可选地,在得到所述第一目标模型之后,所述方法还包括:获取每个所述历史客户在多个预设历史时间段中每个预设历史时间段对应的历史职业、每个所述历史客户在每个所述预设历史时间段对应的历史年龄、每个所述历史客户在每个所述预设历史时间段对应的历史学历以及每个所述历史客户在每个所述预设历史时间段对应的历史消费指标;将所述历史职业、所述历史年龄、所述历史学历、所述历史消费指标、所述性别以及所述民族作为第二样本,每个所述历史客户在每个所述预设历史时间段对应一个第二样本;将每个所述历史客户对应的每个所述第二样本依次输入到所述第一目标模型中,得到每个所述历史客户对应的多个历史收入值,一个第二样本对应一个历史收入值。可选地,在所述通过第二目标模型,得到所述目标客户当前的预测收入值之前,所述方法还包括:根据每个所述历史客户对应的每个所述第二样本、每个所述第二样本对应的所述多个历史收入值以及每个所述第一样本,生成第三样本,一个所述历史客户对应一个第三样本;根据每个所述第三样本,形成第二训练集和第二验证集,所述第二训练集和所述第二验证集合并为全集且所述第二训练集和所述第二验证集无交集;根据所述第二训练集中的第三样本,对所述LSTM模型进行训练,得到训练后的LSTM模型;根据所述第二验证集中的第三样本,对所述训练后的LSTM模型进行验证,得到所述第二验证集中的第三样本对应的待校验当前收入值;若所述第二验证集中的第三样本包含的所述实际收入值与所述第二验证集中的第三样本对应的待校验当前收入值之间的误差在第二预设误差范围内,则将所述训练后的LSTM模型作为所述第二目标模型。可选地,所述目标客户的特征数据包括所述目标客户在每个所述预设历史时间段对应的目标年龄、目标职业、目标民族、目标性别、目标学历、目标消费指标、所述目标客户当前的年龄、所述目标客户当前的职业、所述目标客户当前的目标消费指标、所述目标客户当前的学历;所述根据所述目标客户的特征数据,通过第一目标模型,得到所述目标客户的多个第一目标收入值,包括:将所述目标客户在每个所述预设历史时间段对应的目标年龄、目标职业、目标民族、目标性别、目标学历、目标消费指标作为第一目标数据,一个预设历史时间段对应一个第一目标数据;将每个所述第一目标数据依次输入到所述第一目标模型中,得到所述目标客户在每个所述预设历史时间段对应的目标历史收入值,并将所述目标历史收入值作为所述第一目标收入值。可选地,所述根据所述目标历史收入值和所述目标客户的特征数据,通过第二目标模型,得到所述目标客户当前的预测收入值,包括:将每个所述第一目标数据、与每个所述第一目标数据匹配的所述目标历史收入值、所述目标客户当前的年龄、所述目标客户当前的职业、所述目标客户当前的目标消费指标生成第二目标数据;将所述第二目标数据输入到所述第二目标模型中,得到所述目标客户当前的预测收入值;其中,所述目标客户当前的预测收入值用于表示与所述目标客户在当前的特征数据匹配的预测收入值,所述当前的特征数据包括所述目标客户当前的年龄、所述目标客户当前的职业、所述目标客户当前的目标消费指标、所述目标客户当前的学历、目标民族、目标性别。可选地,在所述得到所述目标客户当前的预测收入值之后,所述方法还包括:根据所述目标客户当前的预测收入值、当前时间节点、所述多个第一目标收入值以及每个所述第一目标收入值对应的历史时间节点,生成时间-收入值趋势图;将所述时间-收入值趋势图发送至目标终端,以使所述目标终端对所述目标客户进行行为分析;在所述得到所述目标客户当前的预测收入值之后,所述方法还包括:根据预设的缺口保额与收入值之间的函数关系和所述目标客户当前的预测收入值,确定所述目标客户当前的预测缺口保额。第二方面,本专利技术实施例提供一种数据预测装置,包括:特征数据获取模块,用于获取目标客户的特征数据,所述目标客户为待预测缺口保额的客户;第一目标收入值确定模块,用于根据所述目标客户的特征数据,通过第一本文档来自技高网...

【技术保护点】
1.一种数据预测方法,其特征在于,包括:/n获取目标客户的特征数据,所述目标客户为待预测缺口保额的客户;/n根据所述目标客户的特征数据,通过第一目标模型,得到所述目标客户的多个第一目标收入值,所述第一目标模型是根据多个历史客户中的每个历史客户的特征数据,对LightGBM模型训练得到的,所述多个第一目标收入值包括所述目标客户在多个预设历史时间段中的每个所述预设历史时间段对应的目标历史收入值;/n根据所述目标历史收入值和所述目标客户的特征数据,通过第二目标模型,得到所述目标客户当前的预测收入值,所述第二目标模型是以通过所述LightGBM模型得到的每个所述历史客户在每个所述历史时间段对应的多个第一历史收入值和每个所述历史客户的特征数据为训练样本,对LSTM模型训练得到的。/n

【技术特征摘要】
1.一种数据预测方法,其特征在于,包括:
获取目标客户的特征数据,所述目标客户为待预测缺口保额的客户;
根据所述目标客户的特征数据,通过第一目标模型,得到所述目标客户的多个第一目标收入值,所述第一目标模型是根据多个历史客户中的每个历史客户的特征数据,对LightGBM模型训练得到的,所述多个第一目标收入值包括所述目标客户在多个预设历史时间段中的每个所述预设历史时间段对应的目标历史收入值;
根据所述目标历史收入值和所述目标客户的特征数据,通过第二目标模型,得到所述目标客户当前的预测收入值,所述第二目标模型是以通过所述LightGBM模型得到的每个所述历史客户在每个所述历史时间段对应的多个第一历史收入值和每个所述历史客户的特征数据为训练样本,对LSTM模型训练得到的。


2.根据权利要求1所述的方法,其特征在于,在通过第一目标模型,得到所述目标客户的多个第一目标收入值之前,所述方法还包括:
获取每个所述历史客户的特征数据,所述历史客户的特征数据包括:年龄、职业、民族、性别、学历、消费指标以及实际收入值;
对所述年龄、职业、民族、性别、学历、消费指标以及实际收入值进行预处理,得到所述年龄、职业、民族、性别、学历、消费指标以及实际收入值分别对应的标签值,所述标签值用于表示所述特征数据的标识符;
以每个所述历史客户对应的所述标签值为一个第一样本,形成第一训练集和第一验证集,所述第一训练集和所述第一验证集合并为全集且所述第一训练集和所述第一验证集无交集;
根据所述第一训练集中的第一样本,对所述LightGBM模型进行训练,得到训练后的LightGBM模型;
根据所述第一验证集中的第一样本,对所述训练后的LightGBM模型进行验证,得到所述第一验证集中的第一样本对应的待校验收入值;
若所述第一验证集中的第一样本包含的所述实际收入值与所述第一验证集中的第一样本对应的待校验收入值之间的误差在第一预设误差范围内,则将所述训练后的LightGBM模型作为所述第一目标模型。


3.根据权利要求2所述的方法,其特征在于,在得到所述第一目标模型之后,所述方法还包括:
获取每个所述历史客户在多个预设历史时间段中每个预设历史时间段对应的历史职业、每个所述历史客户在每个所述预设历史时间段对应的历史年龄、每个所述历史客户在每个所述预设历史时间段对应的历史学历以及每个所述历史客户在每个所述预设历史时间段对应的历史消费指标;
将所述历史职业、所述历史年龄、所述历史学历、所述历史消费指标、所述性别以及所述民族作为第二样本,每个所述历史客户在每个所述预设历史时间段对应一个第二样本;
将每个所述历史客户对应的每个所述第二样本依次输入到所述第一目标模型中,得到每个所述历史客户对应的多个历史收入值,一个第二样本对应一个历史收入值。


4.根据权利要求3所述的方法,其特征在于,在所述通过第二目标模型,得到所述目标客户当前的预测收入值之前,所述方法还包括:
根据每个所述历史客户对应的每个所述第二样本、每个所述第二样本对应的所述多个历史收入值以及每个所述第一样本,生成第三样本,一个所述历史客户对应一个第三样本;
根据每个所述第三样本,形成第二训练集和第二验证集,所述第二训练集和所述第二验证集合并为全集且所述第二训练集和所述第二验证集无交集;
根据所述第二训练集中的第三样本,对所述LSTM模型进行训练,得到训练后的LSTM模型;
根据所述第二验证集中的第三样本,对所述训练后的LSTM模型进行验证,得到所述第二验证集中的第三样本对应的待校验当前收入值;
若所述第二验证集中的第三样本包含的所述实际收入值与所述第二验证集中的第三样本对应的待校验当前收入值之间的误差在第二预设误差范围内,则将所述训练后...

【专利技术属性】
技术研发人员:朱建林周勇李傲梅柴敏周景
申请(专利权)人:泰康保险集团股份有限公司泰康人寿保险有限责任公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1