数据预测方法、装置、设备及存储介质制造方法及图纸

技术编号：25524311 阅读：14 留言：0更新日期：2020-09-04 17:13

本发明专利技术实施例提供一种数据预测方法、装置、设备及存储介质，该方法包括：获取目标客户的特征数据，所述目标客户为待预测缺口保额的客户；根据所述目标客户的特征数据，通过第一目标模型，得到所述目标客户的多个第一目标收入值；根据所述目标历史收入值和所述目标客户的特征数据，通过第二目标模型，得到所述目标客户当前的预测收入值。本实施例提供的方法能够克服在保险领域现有技术针对客户的收入值预测精度较低的问题。

全部详细技术资料下载

【技术实现步骤摘要】
数据预测方法、装置、设备及存储介质
本专利技术实施例涉及数据处理
，尤其涉及一种数据预测方法、装置、设备及存储介质。
技术介绍
随着技术的发展，现在对数据的预测方法各式各样，可以应用到不同的领域。因此，在不同的领域，对于数据预测均有着重要意义。例如，在保险行业，可以对保险客户的缺口保额预测(缺口保额或保费缺口是指客户每年需要配置在保险领域的资产额度)，进一步地为客户提供优质服务。目前有运用线性回归的方法，基于客户信息中记录的缴纳的3-6个月保险费用，来预测保险客户未来时间可以缴纳的保险费用，进一步地预测出保险客户的缺口保额。但是，在保险领域现有技术针对客户的收入值预测精度较低。
技术实现思路
本专利技术实施例提供一种数据预测方法、装置、设备及存储介质，以克服在保险领域现有技术针对客户的收入值预测精度较低的问题。第一方面，本专利技术实施例提供一种数据预测方法，包括：获取目标客户的特征数据，所述目标客户为待预测缺口保额的客户；根据所述目标客户的特征数据，通过第一目标模型，得到所述目标客户的多个第一目标收入值，所述第一目标模型是根据多个历史客户中的每个历史客户的特征数据，对LightGBM模型训练得到的，所述多个第一目标收入值包括所述目标客户在多个预设历史时间段中的每个所述预设历史时间段对应的目标历史收入值；根据所述目标历史收入值和所述目标客户的特征数据，通过第二目标模型，得到所述目标客户当前的预测收入值，所述第二目标模型是以通过所述LightGBM...

【技术保护点】
1.一种数据预测方法，其特征在于，包括：/n获取目标客户的特征数据，所述目标客户为待预测缺口保额的客户；/n根据所述目标客户的特征数据，通过第一目标模型，得到所述目标客户的多个第一目标收入值，所述第一目标模型是根据多个历史客户中的每个历史客户的特征数据，对LightGBM模型训练得到的，所述多个第一目标收入值包括所述目标客户在多个预设历史时间段中的每个所述预设历史时间段对应的目标历史收入值；/n根据所述目标历史收入值和所述目标客户的特征数据，通过第二目标模型，得到所述目标客户当前的预测收入值，所述第二目标模型是以通过所述LightGBM模型得到的每个所述历史客户在每个所述历史时间段对应的多个第一历史收入值和每个所述历史客户的特征数据为训练样本，对LSTM模型训练得到的。/n

【技术特征摘要】
1.一种数据预测方法，其特征在于，包括：
获取目标客户的特征数据，所述目标客户为待预测缺口保额的客户；
根据所述目标客户的特征数据，通过第一目标模型，得到所述目标客户的多个第一目标收入值，所述第一目标模型是根据多个历史客户中的每个历史客户的特征数据，对LightGBM模型训练得到的，所述多个第一目标收入值包括所述目标客户在多个预设历史时间段中的每个所述预设历史时间段对应的目标历史收入值；
根据所述目标历史收入值和所述目标客户的特征数据，通过第二目标模型，得到所述目标客户当前的预测收入值，所述第二目标模型是以通过所述LightGBM模型得到的每个所述历史客户在每个所述历史时间段对应的多个第一历史收入值和每个所述历史客户的特征数据为训练样本，对LSTM模型训练得到的。

2.根据权利要求1所述的方法，其特征在于，在通过第一目标模型，得到所述目标客户的多个第一目标收入值之前，所述方法还包括：
获取每个所述历史客户的特征数据，所述历史客户的特征数据包括：年龄、职业、民族、性别、学历、消费指标以及实际收入值；
对所述年龄、职业、民族、性别、学历、消费指标以及实际收入值进行预处理，得到所述年龄、职业、民族、性别、学历、消费指标以及实际收入值分别对应的标签值，所述标签值用于表示所述特征数据的标识符；
以每个所述历史客户对应的所述标签值为一个第一样本，形成第一训练集和第一验证集，所述第一训练集和所述第一验证集合并为全集且所述第一训练集和所述第一验证集无交集；
根据所述第一训练集中的第一样本，对所述LightGBM模型进行训练，得到训练后的LightGBM模型；
根据所述第一验证集中的第一样本，对所述训练后的LightGBM模型进行验证，得到所述第一验证集中的第一样本对应的待校验收入值；
若所述第一验证集中的第一样本包含的所述实际收入值与所述第一验证集中的第一样本对应的待校验收入值之间的误差在第一预设误差范围内，则将所述训练后的LightGBM模型作为所述第一目标模型。

3.根据权利要求2所述的方法，其特征在于，在得到所述第一目标模型之后，所述方法还包括：
获取每个所述历史客户在多个预设历史时间段中每个预设历史时间段对应的历史职业、每个所述历史客户在每个所述预设历史时间段对应的历史年龄、每个所述历史客户在每个所述预设历史时间段对应的历史学历以及每个所述历史客户在每个所述预设历史时间段对应的历史消费指标；
将所述历史职业、所述历史年龄、所述历史学历、所述历史消费指标、所述性别以及所述民族作为第二样本，每个所述历史客户在每个所述预设历史时间段对应一个第二样本；
将每个所述历史客户对应的每个所述第二样本依次输入到所述第一目标模型中，得到每个所述历史客户对应的多个历史收入值，一个第二样本对应一个历史收入值。

4.根据权利要求3所述的方法，其特征在于，在所述通过第二目标模型，得到所述目标客户当前的预测收入值之前，所述方法还包括：
根据每个所述历史客户对应的每个所述第二样本、每个所述第二样本对应的所述多个历史收入值以及每个所述第一样本，生成第三样本，一个所述历史客户对应一个第三样本；
根据每个所述第三样本，形成第二训练集和第二验证集，所述第二训练集和所述第二验证集合并为全集且所述第二训练集和所述第二验证集无交集；
根据所述第二训练集中的第三样本，对所述LSTM模型进行训练，得到训练后的LSTM模型；
根据所述第二验证集中的第三样本，对所述训练后的LSTM模型进行验证，得到所述第二验证集中的第三样本对应的待校验当前收入值；
若所述第二验证集中的第三样本包含的所述实际收入值与所述第二验证集中的第三样本对应的待校验当前收入值之间的误差在第二预设误差范围内，则将所述训练后...

【专利技术属性】
技术研发人员：朱建林，周勇，李傲梅，柴敏，周景，
申请(专利权)人：泰康保险集团股份有限公司，泰康人寿保险有限责任公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人