【技术实现步骤摘要】
用户投保意愿预测的方法、系统、电子装置和存储介质
[0001]本申请涉及计算机领域,特别是涉及用户投保意愿预测的方法、系统、电子装置和存储介质。
技术介绍
[0002]用户投保意愿的预测,本质上是一个二分类建模的问题。具体地,首先对用户进行用户画像,并根据用户的静态属性、动态行为等对数据进行预处理和特征工程,接着,综合运用统计学和保险业务领域知识对数据进行特征提炼,并在业务上积累获取一定数量的正、负样本后,利用逻辑回归、决策树以及梯度提升树等集成学习算法,甚至是深度学习算法来建立模型,得到预测模型和相应的模型参数。最后根据使用场景的不同对模型进行离线或者在线部署,来预测带相关入模特征的新用户,得到预测结果。基于模型预测得到的结果会被推送给保险业务人员,为保险业务的精准营销提供基础。
[0003]在相关技术中,处理特征工程时需要对用户的行为进行分类,然后根据业务知识对不同类型的行为进行分时段的统计,从次数、频率、变化率等方面对用户进行多方面的描述以获取用户特征数据。因此,现有模型的预测效果严重依赖于特征工程所产生的特征 ...
【技术保护点】
【技术特征摘要】
1.一种用户投保意愿预测的方法,其特征在于,所述方法包括:根据用户行为序列词典,将用户行为序列数据转换成时间序列编码向量和行为序列编码向量;通过CNN模块对低维稠密的行为序列编码向量进行特征提取,得到局部特征向量,并通过带注意力机制的Transformer编码层模块,对低维稠密的时间序列编码向量和行为序列编码向量的结合向量进行特征提取,得到全局特征向量;将所述局部特征向量和所述全局特征向量进行拼接,得到目标向量,并将所述目标向量输入深度神经网络模块进行预测,输出得到待预测目标变量值。2.根据权利要求1所述的方法,其特征在于,在通过神经网络分别对低维稠密的时间序列编码向量和行为序列编码向量进行特征提取之前,所述方法包括:通过Embedding转换层将所述时间序列编码向量和所述行为序列编码向量,分别转换为所述低维稠密的时间序列编码向量和行为序列编码向量。3.根据权利要求1所述的方法,其特征在于,在将用户行为序列数据转换成时间序列编码向量和行为序列编码向量之前,所述方法包括:对所述用户行为序列词典中的所述用户行为序列数据进行编码。4.根据权利要求2所述的方法,其特征在于,在转换得到低维稠密的时间序列编码向量和行为序列编码向量之后,所述方法包括:在所述低维稠密的时间序列编码向量和行为序列编码向量上分别添加不同的标签数据,组成完整的数据样本,预测不同业务场景中待预测目标变量值。5.根据权利要求3所述的方法,其特征在于,在对所述用户行为序列词典中的所述用户行为序列数据进行编码之前,所述方法包括:获取所述用户行为序列词典并编号,其中,所述用户行为序列词典包括合作方编码和所述合作方编码涵盖的所有事件类型,并对所述事件类型进行排列组合。6.一种用户投保意愿预测的系统,其特征在于,所述系统包括:向量转换模块,用于根据用户行为序列词典...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。