一种用户行为预测方法、装置及存储介质制造方法及图纸

技术编号:21301959 阅读:21 留言:0更新日期:2019-06-12 08:33
本申请实施方式公开一种用户行为预测方法、装置及存储介质。方法包括:获取目标用户指定属性的属性数据;将指定属性的属性数据输入所述目标行为预测模型,获得目标用户的目标行为预测结果。目标行为预测模型通过以下方式获得:获取样本集的用户数据,用户数据中包括待筛选的用户属性以及用户目标行为历史数据;基于用户属性的信息增益和信息增益比筛出多个用户属性;再确定出每个用户属性下,用户出现目标行为的可能性预估值,进一步地筛出多个用户属性,形成指定属性集合;根据样本集的指定属性对应的用户数据,训练预设的机器学习模型。本申请实施方式可以提高用户行为预测的准确度。

A User Behavior Prediction Method, Device and Storage Media

The embodiment of this application discloses a user behavior prediction method, device and storage medium. The method includes: acquiring attribute data of specified attributes of target users; inputting attribute data of specified attributes into the target behavior prediction model to obtain the target user's target behavior prediction results. Target behavior prediction model can be obtained by following ways: acquiring user data of sample set, including user attributes to be filtered and user target behavior history data; sifting out multiple user attributes based on information gain and information gain ratio of user attributes; then determining the possibility of user's target behavior under each user attribute, and further sifting out. Multiple user attributes form a set of specified attributes; according to the user data corresponding to the specified attributes of the sample set, the preset machine learning model is trained. The application embodiment can improve the accuracy of user behavior prediction.

【技术实现步骤摘要】
一种用户行为预测方法、装置及存储介质
本申请涉及计算机数据处理
,特别涉及一种用户行为预测方法、装置及存储介质。
技术介绍
随着互联网金融的崛起,金融业的竞争越来越激烈,银行金融机构如果想在竞争中取胜,用户服务能力尤为重要;如果想服务好用户,就必须要对用户行为进行分析和预测,例如用户流失预测,用户违约预测,用户产品偏好分析等,而且对用户行为预测的准确度也提出了更高的要求。预测的准确度高,银行就能更准确地识别用户意图,从而及时进行相关的应对,以提高用户挽留,风险控制,产品营销等应对的成功率,进而极大降低银行的成本。显然,银行金融机构要想在竞争中取胜,建立一个高准确度的用户行为预测模型非常重要。目前来看,银行机构对用户行为进行预测主要是基于相关数据报表、专家经验或者单一数据挖掘模型,这些方法都很难获得准确的预测结果。因此,如何准确地预测用户行为已成为本领域亟待解决的技术问题。
技术实现思路
本申请实施例的目的是提供一种用户行为预测方法、装置及存储介质,以提高用户行为的预测精度。为达到上述目的,本申请实施例提供一种用户行为预测方法,所述方法包括:获取目标用户的指定属性的属性数据;将所述指定属性的属性数据输入所述目标行为预测模型,获得所述目标用户的目标行为预测结果;其中,所述目标行为预测模型预先通过以下方式获得:获取样本集的用户数据,所述用户数据中包括第一属性集合以及用户目标行为历史数据,所述第一属性集合包括多个待筛选的用户属性;确定每个用户属性的信息增益和信息增益比;根据所述信息增益和信息增益比,从所述第一属性集合中筛出多个用户属性,形成第二属性集合;确定在所述第二属性集合中的每个用户属性下,用户出现目标行为的可能性预估值;根据所述可能性预估值,从所述第二属性集合中筛出多个用户属性,形成指定属性集合;根据所述样本集的指定属性对应的用户数据,训练预设的机器学习模型,得到所述目标行为预测模型。优选的,所述根据所述信息增益和信息增益比,从所述第一属性集合中筛出多个用户属性,形成第二属性集合,包括:从所述第一属性集合中,将信息增益大于或者等于预设的信息增益阈值,并且信息增益比大于或者等于预设的信息增益比阈值的用户属性筛选出来,形成第二属性集合。优选的,所述确定在所述第二属性集合中的每个用户属性下,用户出现目标行为的可能性预估值,包括:利用朴素贝叶斯算法,确定所述第二属性集合中的每个用户属性下,用户出现目标行为的概率值;或者,利用极大似然估计算法,确定所述第二属性集合中的每个用户属性下,用户出现目标行为的频率值。优选的,根据所述可能性预估值,从所述第二属性集合中筛出多个用户属性,形成指定属性集合,包括:从所述第二属性集合中,将所述用户出现目标行为的概率值大于或者等于预设的概率阈值的用户属性筛选出来,形成指定属性集合;或者,从所述第二属性集合中,将所述用户出现目标行为的频率值大于或者等于预设的频率阈值的用户属性筛选出来,形成指定属性集合。优选的,根据所述训练集的指定属性对应的用户数据,训练预设的机器学习模型,包括:根据所述训练集的指定属性对应的用户数据,确定所述训练集中每个用户对应的多维特征向量;将所述多维特征向量输入到预设的机器学习模型中进行训练。优选的,所述确定所述训练集中每个用户对应的多维特征向量,包括:根据每个用户的指定属性对应的用户数据构造多维特征向量,其中,所述多维特征向量中的每个元素,与一个所述指定属性相对应;若用户的指定属性满足预设的条件,则将该指定属性所对应的用户出现目标行为的可能性预估值,作为该用户的多维特征向量中与该指定属性相对应的元素的值;若用户的指定属性不满足预设的条件,则将该用户的多维特征向量中与该指定属性相对应的元素的值设置为零值。优选的,所述预设的机器学习模型包括:梯度提升树模型;或者,随机森林模型。优选的,在获取所述第一属性集合之前,还包括:根据XGBOOST模型对所述用户属性进行重要性评分,将大于或者等于预设的评分阈值的用户属性归入到所述第一属性集合中。另一方面,本申请实施例还提供一种用户行为预测装置,该装置包括:数据获取模块,用于获取目标用户的指定属性的属性数据;预测结果获取模块,用于将所述指定属性的属性数据输入所述目标行为预测模型,获得所述目标用户的目标行为预测结果;其中,构建所述目标行为预测模型包括如下模块:预测模型提供模块,用于提供目标行为预测模型;目标用户数据获取模块,用于获取目标用户的指定属性的属性数据;预测结果获取模块,用于将所述指定属性的属性数据输入所述目标行为预测模型,获得所述目标用户的目标行为预测结果;其中,所述预测模型提供模块包括:样本集数据获取子模块,用于获取样本集的用户数据,所述用户数据中包括第一属性集合以及用户目标行为历史数据,所述第一属性集合包括多个待筛选的用户属性;第一计算子模块,用于确定每个用户属性的信息增益和信息增益比;第一筛选子模块,用于根据所述信息增益和信息增益比,从所述第一属性集合中筛出多个用户属性,形成第二属性集合;第二计算子模块,用于确定在所述第二属性集合中的每个用户属性下,用户出现目标行为的可能性预估值;第二筛选子模块,用于根据所述可能性预估值,从所述第二属性集合中筛出多个用户属性,形成指定属性集合;模型训练子模块,用于根据所述样本集的指定属性对应的用户数据,训练预设的机器学习模型,得到所述目标行为预测模型。另一方面,本申请实施例还提供一种用户行为预测装置,包括存储器、处理器、以及存储在所述存储器上的计算机程序,所述计算机程序被所述处理器运行时执行如下步骤:获取目标用户的指定属性的属性数据;将所述指定属性的属性数据输入所述目标行为预测模型,获得所述目标用户的目标行为预测结果;其中,所述目标行为预测模型预先通过以下方式获得:获取样本集的用户数据,所述用户数据中包括第一属性集合以及用户目标行为历史数据,所述第一属性集合包括多个待筛选的用户属性;确定每个用户属性的信息增益和信息增益比;根据所述信息增益和信息增益比,从所述第一属性集合中筛出多个用户属性,形成第二属性集合;确定在所述第二属性集合中的每个用户属性下,用户出现目标行为的可能性预估值;根据所述可能性预估值,从所述第二属性集合中筛出多个用户属性,形成指定属性集合;根据所述样本集的指定属性对应的用户数据,训练预设的机器学习模型,得到所述目标行为预测模型。本申请实施例还提供一种计算机存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:获取目标用户的指定属性的属性数据;将所述指定属性的属性数据输入所述目标行为预测模型,获得所述目标用户的目标行为预测结果;其中,所述目标行为预测模型预先通过以下方式获得:获取样本集的用户数据,所述用户数据中包括第一属性集合以及用户目标行为历史数据,所述第一属性集合包括多个待筛选的用户属性;确定每个用户属性的信息增益和信息增益比;根据所述信息增益和信息增益比,从所述第一属性集合中筛出多个用户属性,形成第二属性集合;确定在所述第二属性集合中的每个用户属性下,用户出现目标行为的可能性预估值;根据所述可能性预估值,从所述第二属性集合中筛出多个用户属性,形成指定属性集合;根据所述样本集的指定属性对应的用户数据,训练预设的机器学习模型,得本文档来自技高网...

【技术保护点】
1.一种用户行为预测方法,其特征在于,包括:提供目标行为预测模型;获取目标用户的指定属性的属性数据;将所述指定属性的属性数据输入所述目标行为预测模型,获得所述目标用户的目标行为预测结果;其中,所述目标行为预测模型预先通过以下方式获得:获取样本集的用户数据,所述用户数据中包括第一属性集合以及用户目标行为历史数据,所述第一属性集合包括多个待筛选的用户属性;确定每个用户属性的信息增益和信息增益比;根据所述信息增益和信息增益比,从所述第一属性集合中筛出多个用户属性,形成第二属性集合;确定在所述第二属性集合中的每个用户属性下,用户出现目标行为的可能性预估值;根据所述可能性预估值,从所述第二属性集合中筛出多个用户属性,形成指定属性集合;根据所述样本集的指定属性对应的用户数据,训练预设的机器学习模型,得到所述目标行为预测模型。

【技术特征摘要】
1.一种用户行为预测方法,其特征在于,包括:提供目标行为预测模型;获取目标用户的指定属性的属性数据;将所述指定属性的属性数据输入所述目标行为预测模型,获得所述目标用户的目标行为预测结果;其中,所述目标行为预测模型预先通过以下方式获得:获取样本集的用户数据,所述用户数据中包括第一属性集合以及用户目标行为历史数据,所述第一属性集合包括多个待筛选的用户属性;确定每个用户属性的信息增益和信息增益比;根据所述信息增益和信息增益比,从所述第一属性集合中筛出多个用户属性,形成第二属性集合;确定在所述第二属性集合中的每个用户属性下,用户出现目标行为的可能性预估值;根据所述可能性预估值,从所述第二属性集合中筛出多个用户属性,形成指定属性集合;根据所述样本集的指定属性对应的用户数据,训练预设的机器学习模型,得到所述目标行为预测模型。2.根据权利要求1所述的方法,其特征在于,所述根据所述信息增益和信息增益比,从所述第一属性集合中筛出多个用户属性,形成第二属性集合,包括:从所述第一属性集合中,将信息增益大于或者等于预设的信息增益阈值,并且信息增益比大于或者等于预设的信息增益比阈值的用户属性筛选出来,形成第二属性集合。3.根据权利要求1所述的方法,其特征在于,所述确定在所述第二属性集合中的每个用户属性下,用户出现目标行为的可能性预估值,包括:利用朴素贝叶斯算法,确定所述第二属性集合中的每个用户属性下,用户出现目标行为的概率值;或者,利用极大似然估计算法,确定所述第二属性集合中的每个用户属性下,用户出现目标行为的频率值。4.根据权利要求3所述的方法,其特征在于,根据所述可能性预估值,从所述第二属性集合中筛出多个用户属性,形成指定属性集合,包括:从所述第二属性集合中,将所述用户出现目标行为的概率值大于或者等于预设的概率阈值的用户属性筛选出来,形成指定属性集合;或者,从所述第二属性集合中,将所述用户出现目标行为的频率值大于或者等于预设的频率阈值的用户属性筛选出来,形成指定属性集合。5.根据权利要求1所述的方法,其特征在于,所述根据所述样本集的指定属性对应的用户数据,训练预设的机器学习模型,包括:根据所述样本集的指定属性对应的用户数据,确定所述样本集中每个用户对应的多维特征向量;将所述多维特征向量输入到预设的机器学习模型中进行训练。6.根据权利要求5所述的方法,其特征在于,所述确定所述样本集中每个用户对应的多维特征向量,包括:根据每个用户的指定属性对应的用户数据构造多维特征向量,其中,所述多维特征向量中的每个元素,与一个所述指定属性相对应;若用户的指定属性满足预设的条件,则将该指定属性所对应的用户出现目标行为的可能性预估值,作为该用户的多维特征向量中与该指定属性相对应的元素的值;若用户的指定属性不满足预设的条件,则将该用户的多维特征向量中与该指定属性相对应的元素的值设置为零值。7.根据权利要求1所述的方法,其特征在于,所述预设的机器学习模型包括:梯度提升树模型;或者,随机森林模型。8.根据权利要求1所述的方法,其特征在于,在获取所述第一属性集合之前,还包括:根...

【专利技术属性】
技术研发人员:梁磊
申请(专利权)人:中国银行股份有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1