一种基于机器学习的客户价值模型优化方法技术

技术编号:17098171 阅读:15 留言:0更新日期:2018-01-21 10:21
本发明专利技术涉及一种基于机器学习的客户价值模型优化方法,包括如下的步骤:步骤1:通过随机采样法提取N个客户主体不同时期的客户价值模型数据,得到初始模型数据样本Si(i=1、2、3...N);步骤2:对给个初始模型数据样本Si(i=1、2、3...n)分别使用bagging机器学习方法,相对应地训练出N个独立的个体弱学习器Hi(i=1、2、3...N);步骤3:通过stacking结合策略将所述的个体弱学习器Hi(i=1、2、3...N)结合成一个强学习器H;步骤4:将强学习器H作为最优模型规则,并将当前客户价值模型数据样本输入到强学习器H,强学习器H得出的结果为最优结果模型。

An optimization method of customer value model based on machine learning

The invention relates to a machine learning based optimization method of customer value model, which comprises the following steps: Step 1: customer value model through random sampling method of N data extraction main customers of different periods, to obtain the initial model data sample Si (I = 1, 2, 3... N); step 2: to give a model of initial data sample Si (I = 1, 2, 3... N) respectively using bagging machine learning method and corresponding training N individual weak learner Hi (I = 1, 2, 3... N); step 3: the stacking combined with the strategy will be the individual weak learning Hi (I = 1, 2, 3... N) combined into a strong learner H; step 4: strong learner H rules as the optimal model, and the input current customer value model data into strong learner H, strong learner results obtained by H for the optimal results of the model.

【技术实现步骤摘要】
一种基于机器学习的客户价值模型优化方法
本专利技术涉及一种交易数据的处理方法,尤其涉及一种基于机器学习的客户价值模型优化方法。
技术介绍
目前,传统的模型优化方式,是采用实验对比进行验证。针对目标识别类模型,根据需要优化模型应用场景,选择对比数据,数据中包含一部分目标数据和其他干扰数据。将测试数据导入模型运行,查看模型输出结果中目标数据的识别数量,进行模型效果判断。模型效果判断主要通过,目标数据的查全率和查准率,两个指标进行衡量:查全率,是指模型运算结果中,包含目标数据样本个数,占检测数据中目标数据样本的百分比。查准率,是指模型运算结果中,包含目标数据样本个数,占全部模型识别样本个数的百分比。针对指标预测类模型,同样选择历史数据导入模型,根据模型运算结果与实际数据进行比较,计算误差范围,若误差范围符合模型精度设计要求,则模型不需要优化;若误差范围超过模型精度要求,则需要进行模型优化。同样目前行业应用模型的优化过程,基本上同模型新建过程一致,需要重新进行模型输入数据进行关联分析,导入新的数据字段替换原有数据信息。模型算法方面,则是根据优化当时,整体社会基础算法研究现状,选择更好的算法替代原有算法。通过上述对目前行业模型优化的说明,可以看出,现有模型优化的方式比较传统,耗费人力、时间成本较高,效率较低。同时现有行业应用模型优化,必须在实验条件下才能完成,无法自动在真实运行环境下进行实时优化,耽误实际商业应用,如果模型应用是某些企业的核心机制,模型优化过程,也会给企业带来较大的利益损失。因此,也实际造成多数企业,不愿花费如此高的代价进行模型优化,仍沿用老旧模型,同样也影响了模型实际效果。
技术实现思路
为解决上述技术问题,本专利技术的目的是提供一种基于机器学习的客户价值模型优化方法,该客户价值模型优化方法能够降低人力、时间成本,提高数据优化效率,同时也保证模型应用的效果,提高使用效益。本专利技术的一种基于机器学习的客户价值模型优化方法,其特点在于,该方法包括如下的步骤:步骤1:通过随机采样法提取N个客户主体不同时期的客户价值模型数据,得到初始模型数据样本Si(i=1、2、3...N);步骤2:对各个初始模型数据样本Si(i=1、2、3...n)分别使用bagging机器学习方法,相对应地训练出N个独立的个体弱学习器Hi(i=1、2、3...N);步骤3:通过stacking结合策略将步骤2中所述的个体弱学习器Hi(i=1、2、3...N)结合成一个强学习器H;步骤4:将步骤3得到的强学习器H作为最优模型规则,并将当前客户价值模型数据样本输入到强学习器H,强学习器H得出的结果为最优结果模型。进一步的,步骤1中的随机采样法为自助采样法(Bootstapsampling),即对于N个样本的原始训练集,每次先随机采集一个样本放入采样集,接着把该样本放回,这样采集N次,直到得到N个样本的采样集为止。进一步的,步骤3中的stacking结合策略包括如下的步骤:先从客户价值模型数据集中随机抽取45%-55%数据样本作为训练集,同时从客户价值模型数据集中随机抽取20%-30%数据样本作为测试集;再训练一个次级学习器,在训练次级学习器的过程中将各个体弱学习器Hi(i=1、2、3...N)的学习结果作为次级学习器的输入,将训练集的结果作为次级学习器的输出;最后用初级学习器对测试集预测一次,得到次级学习器的输入样本,再用次级学习器对测试集预测一次得到预测样本,同时对输入样本和预测样本之间的数据关联匹配关系的不断训练,达到最优输出结果下的最佳模型输入以及过程参数取值范围,从而得到强学习器H。进一步的,所述的数据关联匹配关系包括客户价值模型输入数据、过程参数、和输出结果三者之间的关联匹配关系,所述的过程参数为客户价值模型数据中各指标的权重或者划分客户类别指标的取值范围,所述的输出结果为客户的价值标签或客户细分规则。进一步的,所述的客户价值模型数据包括指标体系中的数据字段、指标权重、模型算法和模型结果。进一步的,从客户价值模型数据集中随机抽取50%数据样本作为训练集,同时从客户价值模型数据集中随机抽取25%数据样本作为测试集。借由上述方案,本专利技术至少具有以下优点:本专利技术根据用户不断的使用,同时结合不同用户,针对同一行业应用场景,采用的差异化的数据挖掘模型,使得行业应用模型具备自动学习、实时优化的能力,即从模型构建完成,实际应用那一刻起,就在不断的自动学习,自动优化,包括模型输入数据和模型算法,确保模型随时都处于最优状态,规避了传统模型优化带来的人力、时间、利益损失,同时也保证模型应用效果,间接为客户带来巨大收益。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,并可依照说明书的内容予以实施,以下以本专利技术的较佳实施例并配合附图详细说明如后。附图说明图1是本专利技术的工作流程图。具体实施方式下面结合附图和实施例,对本专利技术的具体实施方式作进一步详细描述。以下实施例用于说明本专利技术,但不用来限制本专利技术的范围。参见图1本专利技术一较佳实施例所述的一种基于机器学习的客户价值模型优化方法,包括如下的步骤:步骤1:通过随机采样法提取N个客户主体不同时期的客户价值模型数据,得到初始模型数据样本Si(i=1、2、3...N);步骤2:对各个初始模型数据样本Si(i=1、2、3...n)分别使用bagging机器学习方法,相对应地训练出N个独立的个体弱学习器Hi(i=1、2、3...N);步骤3:通过stacking结合策略将步骤2中所述的个体弱学习器Hi(i=1、2、3...N)结合成一个强学习器H;步骤4:将步骤3得到的强学习器H作为最优模型规则,并将当前客户价值模型数据样本输入到强学习器H,强学习器H得出的结果为最优结果模型。作为本专利技术的进一步改进,步骤1中的随机采样法为自助采样法(Bootstapsampling),即对于N个样本的原始训练集,每次先随机采集一个样本放入采样集,接着把该样本放回,这样采集N次,直到得到N个样本的采样集为止。作为本专利技术的进一步改进,步骤3中的stacking结合策略包括如下的步骤:先从客户价值模型数据集中随机抽取45%-55%数据样本作为训练集,同时从客户价值模型数据集中随机抽取20%-30%数据样本作为测试集;再训练一个次级学习器,在训练次级学习器的过程中将各个体弱学习器Hi(i=1、2、3...N)的学习结果作为次级学习器的输入,将训练集的结果作为次级学习器的输出;最后用初级学习器对测试集预测一次,得到次级学习器的输入样本,再用次级学习器对测试集预测一次得到预测样本,同时对输入样本和预测样本之间的数据关联匹配关系的不断训练,达到最优输出结果下的最佳模型输入以及过程参数取值范围,从而得到强学习器H。作为本专利技术的进一步改进,所述的数据关联匹配关系包括客户价值模型输入数据、过程参数、和输出结果三者之间的关联匹配关系,所述的过程参数为客户价值模型数据中各指标的权重或者划分客户类别指标的取值范围,所述的输出结果为客户的价值标签或客户细分规则。作为本专利技术的进一步改进,所述的客户价值模型数据包括指标体系中的数据字段、指标权重、模型算法和模型结果。作为本专利技术的进一步改进,从客户价值模型数据集中随机抽取50%数据样本作为训练本文档来自技高网
...
一种基于机器学习的客户价值模型优化方法

【技术保护点】
一种基于机器学习的客户价值模型优化方法,其特征在于,包括如下的步骤:步骤1:通过随机采样法提取N个客户主体不同时期的客户价值模型数据,得到初始模型数据样本Si(i=1、2、3...N);步骤2:对各个初始模型数据样本Si(i=1、2、3...n)分别使用bagging机器学习方法,相对应地训练出N个独立的个体弱学习器Hi(i=1、2、3...N);步骤3:通过stacking结合策略将步骤2中所述的个体弱学习器Hi(i=1、2、3...N)结合成一个强学习器H;步骤4:将步骤3得到的强学习器H作为最优模型规则,并将当前客户价值模型数据样本输入到强学习器H,强学习器H得出的结果为最优结果模型。

【技术特征摘要】
1.一种基于机器学习的客户价值模型优化方法,其特征在于,包括如下的步骤:步骤1:通过随机采样法提取N个客户主体不同时期的客户价值模型数据,得到初始模型数据样本Si(i=1、2、3...N);步骤2:对各个初始模型数据样本Si(i=1、2、3...n)分别使用bagging机器学习方法,相对应地训练出N个独立的个体弱学习器Hi(i=1、2、3...N);步骤3:通过stacking结合策略将步骤2中所述的个体弱学习器Hi(i=1、2、3...N)结合成一个强学习器H;步骤4:将步骤3得到的强学习器H作为最优模型规则,并将当前客户价值模型数据样本输入到强学习器H,强学习器H得出的结果为最优结果模型。2.根据权利要求1所述的基于集成学习Bagging算法的客户价值模型优化方法,其特征在于:步骤1中的随机采样法为自助采样法(Bootstapsampling),即对于N个样本的原始训练集,每次先随机采集一个样本放入采样集,接着把该样本放回,这样采集N次,直到得到N个样本的采样集为止。3.根据权利要求1所述的基于集成学习Bagging算法的客户价值模型优化方法,其特征在于:步骤3中的stacking结合策略包括如下的步骤:先从客户价值模型数据集中随机抽取45%-55%数据样本作为训练集,同时从客户价值模型数据集中...

【专利技术属性】
技术研发人员:李星龙李伟汤紫瑜
申请(专利权)人:欧若纳信息科技苏州有限公司
类型:发明
国别省市:江苏,32

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1