一种基于XGBoost模型的智能营销方法技术

技术编号:37643160 阅读:14 留言:0更新日期:2023-05-25 10:09
本发明专利技术涉及智能营销技术领域,具体为一种基于XGBoost模型的智能营销方法。包括:S1:进行数据采集并构建多维度用户标签体系;S2:根据缺失率自动处理数据缺失值;S3:设置“用户是否响应”标签为因变量Y,多维度用户标签为自变量X,以历史触达用户为训练集,利用XGBoost分类算法对模型进行训练;S4:利用模型生成响应分数指标,得出高意向用户,并应用到智能营销场景中。本技术方案能够对有意向的用户进行精准营销,从而提高用户体验。从而提高用户体验。从而提高用户体验。

【技术实现步骤摘要】
一种基于XGBoost模型的智能营销方法


[0001]本专利技术涉及智能营销
,具体为一种基于XGBoost模型的智能营销方法。

技术介绍

[0002]银行的金融产品营销普遍采取的是人工营销和机器营销。其中,人工营销效率偏低、成本较高;而机器营销主要是通过播放预设营销话术进行营销,能够降低人力成本。此外,采用机器人的方式去对客户实施营销手段,还能避免了人工疲倦时导致话术失误等问题,这让机器营销成为了银行营销的趋势。
[0003]但目前机器营销的缺点在于成功率过低,客户千面千相,对其兴趣爱好难以捉摸,缺少能够识别用户意向程度的方法和模型,难以对有意向的用户进行精准营销,导致营销转化率低、成本高、用户体验不够好。

技术实现思路

[0004]本专利技术的目的在于:提出一种基于XGBoost模型的智能营销方法,该技术方案能够对有意向的用户进行精准营销,从而提高用户体验。
[0005]为解决上述问题,本专利技术提供的基础方案:一种基于XGBoost模型的智能营销方法,包括:S1:进行数据采集并构建多维度用户标签体系;S2:根据缺失率自动处理数据缺失值;
[0006]S3:设置“用户是否响应”标签为因变量Y,多维度用户标签为自变量X,以历史触达用户为训练集,利用XGBoost分类算法对模型进行训练;S4:利用模型生成响应分数指标,得出高意向用户,并应用到智能营销场景中。
[0007]基础方案的有益效果:S1多维度对客户标记标签,能够更准确地描述客户;通过S2自动对有缺失值的样本进行划分,无需对缺失特征进行填充预处理;通过S3进行训练使XGBoost模型得到高意向用户精准营销,使得后续开展营销能够针对有意向的用户进行;S4得到最终结果,并应用到智能营销场景中,提升用户体验。
[0008]作为优选方案,所述多维度用户标签体系设有用户标签一级分类、用户标签二级分类、用户标签三级分类,用户标签三级分类下还细化分类有各类标签。
[0009]通过细化分类以及标签类型,为模型提供全且准的用户特征,使结果更加准确,有效提升用户转化率。
[0010]作为优选方案,所述S2对于缺失率位于10%—70%范围内的特征单独分为一类,当树按照该类特征分裂时,先不考虑缺失值,按照有值的序列选择最优分裂点进行分裂,然后再分别将缺失值样本带入左子节点和右子节点,分别计算损失,保留损失小的分裂方向。
[0011]在样本量不够大时,直接删除缺失值会造成样本量进一步减少,而填充可能会造成数据偏离,对于缺失值处于可接受范围内的特征进行分析,尽量减小损失,这一设定有利于为一些缺乏样本的新营销产品或业务保留更多的样本量。
[0012]作为优选方案,所述S3中XGBoost模型的目标函数=传统损失函数+模型复杂度,
其中“模型复杂度”为L2正则化项。
[0013]引入L2正则化项,能够避免某一个特征的参数过大,对结果造成决定性影响,以此来保证模型有较好的预测能力。
[0014]作为优选方案,L2正则化项参数取值范围设定为[0,+∞),且默认为1,常用调参候选值在范围(0,1]中进行选取。
[0015]L2正则化项尽可能地小,以降低“模型复杂度”,进一步保证模型有较好的预测能力。
[0016]作为优选方案,所述S3中还利用ROC曲线和AUC值对训练出的模型的分类性能进行评估,具体为:对以下指标进行评估:真阳TP、伪阳FP、真阴FN、伪阴TN,FPRate在所有负类样本中,预测为正类的比例,TPRate在所有正类样本中,预测为正类的比例。
[0017]进行分类性能评估,验证模型是否合格,以保证最终营销的精准性。
[0018]作为优选方案,所述S3还包括S32:持续补充历史触达用户数据、新的多维度用户标签,对模型进行验证、迭代优化和参数修正。
[0019]不断扩充训练集以及多维度用户标签,使模型数据源更丰富,不断迭代和修正也使得更加准确,并且还具有时效性。
[0020]作为优选方案,所述S4中将待营销的用户客群作为预测数据集,确定待营销用户客群的考虑因素包括政策覆盖范围、产品准入标准、人行标准,再结合我行风险政策准入的用户作为最终的目标客群。
[0021]通过多重因素在确定待营销用户客群时尽可能缩小范围,从源头上使得高意向客户的预测更加准确,并且在一开始就进行筛选还能节约算力资源。
[0022]作为优选方案,还包括S5:利用营销响应模型得出用户对某一信贷产品的购买意向。
[0023]通过预测用户对具体产品的购买意向,能够实现更加精准的营销,提高用户转化率。
附图说明
[0024]图1是一种基于XGBoost模型的智能营销方法的逻辑图;
[0025]图2是ROC曲线所处坐标轴的示意图。
具体实施方式
[0026]下面通过具体实施方式对本申请技术方案进行进一步详细说明:
[0027]如图1所示为一种基于XGBoost模型的智能营销方法,包括以下步骤:
[0028]S1:进行数据采集并构建多维度用户标签体系,具体包括:
[0029]S11:采集数据,所采集的信息包括但不限于包括我行设备的行为数据、组织用户行为、历史营销触达记录、历史营销响应记录、业务指标等数据。采集行为包括但不限于用户在我行APP或官网的登录设备、登录时间、登录频次等;以及在营销链接中的停留时长、页面交互行为等,以及在业务流程如授信申请流程中各环节耗时信息、流程中断信息等。
[0030]S12:生成多维度用户标签,多维度用户标签设有用户标签一级分类、用户标签二级分类、用户标签三级分类,用户标签二级分类为用户标签一级分类的细化分类,用户标签
三级分类为用户标签二级分类的细化分类,具体类别如表1所示:
[0031][0032][0033]表1
[0034]三级分类下还包括具体细分的标签,最终生成的多维度用户标签示例如表2所示:
[0035][0036][0037]表2
[0038]S2:数据缺失值处理,处理缺失值有如下三种方法:对于缺失率小于10%的特征,视特征分布情况选用平均数、中位数或众数填充;对于缺失率大于70%的特征,直接删除,避免人为填充带来数据误差;对于缺失率位于10%—70%范围内的特征,把缺失值单独分为一类,暂时不考虑缺失值,这个类别可以定义为任何值,不具有实际意义。
[0039]在本实施例中,一般优选采用第三种方案,在XGBoost训练过程中,某一个特征存在缺失值,当树按照该类特征分裂时,先不考虑缺失值,按照有值的序列选择最优分裂点进行分裂,然后再分别将缺失值样本带入左子节点和右子节点,分别计算损失,保留整体损失较小的分裂方向,预测时缺失值样本也按照该方向进行分裂。
[0040]S3:对XGBoost模型进行训练,具体包括:
[0041]S31:利用XGBoost分类算法进行模型训练,以最终实现对用户分类,具体包括:
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于XGBoost模型的智能营销方法,其特征在于:包括:S1:进行数据采集并构建多维度用户标签体系;S2:根据缺失率自动处理数据缺失值;S3:设置“用户是否响应”标签为因变量Y,多维度用户标签为自变量X,以历史触达用户为训练集,利用XGBoost分类算法对模型进行训练;S4:利用模型生成响应分数指标,得出高意向用户,并应用到智能营销场景中。2.根据权利要求1所述的一种基于XGBoost模型的智能营销方法,其特征在于:所述多维度用户标签体系设有用户标签一级分类、用户标签二级分类、用户标签三级分类,用户标签三级分类下还细化分类有各类标签。3.根据权利要求1所述的一种基于XGBoost模型的智能营销方法,其特征在于:所述S2对于缺失率位于10%—70%范围内的特征单独分为一类,当树按照该类特征分裂时,先不考虑缺失值,按照有值的序列选择最优分裂点进行分裂,然后再分别将缺失值样本带入左子节点和右子节点,分别计算损失,保留损失小的分裂方向。4.根据权利要求1所述的一种基于XGBoost模型的智能营销方法,其特征在于:所述S3中XGBoost模型的目标函数=传统损失函数+模型复杂度,其中“模型复杂度”为L2正则化项。5.根据权利要求4所...

【专利技术属性】
技术研发人员:马攀谭广
申请(专利权)人:重庆富民银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1