复购商机挖掘方法、电子设备和存储介质技术

技术编号:37772224 阅读:13 留言:0更新日期:2023-06-06 13:37
本发明专利技术提供一种复购商机挖掘方法,包括以下步骤:采集业务数据库中的客户信息,生成数据集;对企业客户的特征数据进行处理;采用随机森林算法构建复购预测模型;根据所述复购预测模型进行复购商机的挖掘。本发明专利技术为复购商机挖掘方法及相关电子设备和存储介质,通过机器学习的方法,构建出一种基于企业公开信息数据、行为数据、业务数据的算法模型,通过该模型对企业客户池进行自动的复购商机挖掘,提高了商机挖掘准确性,并降低了成本。并降低了成本。并降低了成本。

【技术实现步骤摘要】
复购商机挖掘方法、电子设备和存储介质


[0001]本专利技术涉及企业服务
,特别涉及一种基于大数据和机器学习的复购商机挖掘方法、电子设备和存储介质。

技术介绍

[0002]随着企业服务领域的发展和成熟,企业服务领域内开始进入深度竞争阶段,表现为企业的获客成本越来越高,企业开始更加重视老客户的商机挖掘和复购。在企业服务领域内,最原始的老客户的商机挖掘方法是通过系统调取客户数据,然后通过短信、电话轰炸的方式去挖掘客户的复购需求。这种模式简单粗暴、可能会严重骚扰客户,而且效率低下、投入产出比低。伴随着大数据技术的飞速发展,企业客户的工商、知产、招聘、新闻、招投标等社会公开信息数据越来越丰富和完善,使得企业很容易对企业客户进行各种维度的数据画像。这种基于画像的老客户商机挖掘系统相对来说,精准度有了一定的提升,但没有和企业内部系统数据打通,没有形成配合,因而会存在需求挖掘错误的情况,此时,还需要专业销售人员对客户数据和需求进行二次的人工判断,因此投入产出比也不高。

技术实现思路

[0003]为了解决现有技术存在的问题,本专利技术提供一种复购商机挖掘方法、电子设备和存储介质,通过机器学习的方法,构建出一种基于企业公开信息数据、行为数据、业务数据的算法模型,通过该模型对企业客户池进行自动的复购商机挖掘,提高商机挖掘准确性,并降低了成本。
[0004]为实现上述目的,本专利技术提供的一种复购商机挖掘方法,包括以下步骤:
[0005]采集业务数据库中的客户信息,生成数据集;
[0006]对企业客户的特征数据进行处理;
[0007]采用随机森林算法构建复购预测模型;
[0008]根据所述复购预测模型进行复购商机的挖掘。
[0009]进一步地,所述采集业务数据库中的客户信息,生成数据集的步骤,包括:
[0010]采集所述业务数据库中成单企业客户的信息,写入客户信息表中,所述客户信息表包括所有的所述成单企业客户以及成单信息;
[0011]采集所述成单企业客户的用户行为日志数据,并结合商业接口数据,对所述用户行为日志数据进行清洗和标签化处理,得到所述成单企业客户的标签数据,写入标签数据表中,所述标签数据表包含了所述成单企业客户所有的公开信息数据标签和行为数据标签。
[0012]进一步地,还包括,从所述客户信息表中随机抽取客户信息生成训练数据集,构建复购预测模型,并从所述客户信息表中随机抽取有复购行为的客户信息生成测试数据集,进行所述复购预测模型的验证。
[0013]进一步地,所述对企业客户的特征数据进行处理的步骤,还包括,
[0014]通过离散值η来衡量企业客户特征数据对复购决策的影响;
[0015]所述离散值η的计算公式为:
[0016][0017]其中,P
i
为复购客户群体在特征数据的n个特征值上的统计值,Q
i
为未复购客户群体在特征数据的n个特征值上的统计值,n为正整数;
[0018]将计算后的所述离散值进行排序,根据排序结果从所述成单企业客户的行为数据中选择所述行为数据的特征数据,从所述公开信息数据中选择企业公开信息数据的特征数据。
[0019]进一步地,所述采用随机森林算法构建复购预测模型的步骤,还包括,
[0020]构建所述复购预测模型包括设置三个主要参数,所述三个主要参数分别为所述随机森林算法允许单个决策树使用特征的最大数量、所述随机森林算法中最大决策树个数和所述随机森林算法中决策树中最小样本叶片大小;
[0021]根据所述三个主要参数和sklearn机器学习工具包完成所述复购预测模型的构建。
[0022]进一步地,还包括,
[0023]定义成单企业客户的推荐得分,对所述成单企业客户的复购意愿进行评估;
[0024]所述推荐得分的计算公式为:
[0025]Score=100*N
决策树正预测数
/M
决策树总数
[0026]其中,N
决策树正预测数
为决策树正预测数,根据所述随机森林算法计算出所述决策树正预测数;M
决策树总数
为决策树总数。
[0027]进一步地,还包括,进行所述复购预测模型的参数的调优,选择得分最好的所述三个主要参数的组合作为所述复购预测模型的参数。
[0028]进一步地,所述根据所述复购预测模型进行复购商机的挖掘的步骤,还包括,根据复购预测模型计算每个所述成单企业客户的复购得分即所述推荐得分,并写入推荐得分表中,设置定时任务进行商机的推送,完成所述推荐得分表中满足推荐条件的成单企业客户的购买转化。
[0029]为实现上述目的,本专利技术还提供一种电子设备,包括存储器和处理器,所述存储器上储存有在所述处理器上运行的程序,所述处理器运行所述程序时执行上述的复购商机挖掘方法的步骤。
[0030]为实现上述目的,本专利技术还提供一种计算机可读存储介质,其上存储有计算机指令,所述计算机指令运行时执行上述的复购商机挖掘方法的步骤。
[0031]本专利技术提供的复购商机挖掘方法、电子设备和存储介质,具有以下有益效果:
[0032]1)采集客户企业公开信息数据、用户行为数据以及业务数据,并结合机器学习算法实现了企业服务领域的复购商机挖掘系统。
[0033]2)在处理企业客户复杂而繁多的特征数据时,定义了离散值概念和技术方法,来优选有效的特征数据。
[0034]3)根据业务和数据特点,本专利技术采用随机森林的算法来构建企业服务领域里的复购商机挖掘模型,使得预测更稳定,准确度更高。
[0035]4)定义了企业客户的复购推荐得分,用这种方式可以更好的去评估企业客户复购意愿大小。
[0036]本专利技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术而了解。
附图说明
[0037]附图用来提供对本专利技术的进一步理解,并且构成说明书的一部分,并与本专利技术的实施例一起,用于解释本专利技术,并不构成对本专利技术的限制。在附图中:
[0038]图1为根据本专利技术实施例的复购商机挖掘方法的流程图;
[0039]图2为根据本专利技术实施例的复购商机挖掘方法中采用的企业标签数据库示意图;
[0040]图3为根据本专利技术实施例的复购商机挖掘方法中用户行为特征数据离散值计算示例示意图;
[0041]图4为根据本专利技术实施例的复购商机挖掘方法中企业公开信息特征数据离散值计算示例示意图;
[0042]图5为根据本专利技术实施例的复购商机挖掘方法中n_estimators=10时测试正确率示意图;
[0043]图6为根据本专利技术实施例的复购商机挖掘方法中min_sample_leaf=100时测试正确率示意图;
[0044]图7为根据本专利技术实施例的复购商机挖掘方法中复购商机推荐流程示意图;
[0045]图8为根据本专利技术实施例的采用复购商机挖掘方法所取得的推荐本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种复购商机挖掘方法,其特征在于,包括以下步骤:采集业务数据库中的客户信息,生成数据集;对企业客户的特征数据进行处理;采用随机森林算法构建复购预测模型;根据所述复购预测模型进行复购商机的挖掘。2.根据权利要求1所述的复购商机挖掘方法,其特征在于,所述采集业务数据库中的客户信息,生成数据集的步骤,包括:采集所述业务数据库中成单企业客户的信息,写入客户信息表中,所述客户信息表包括所有的所述成单企业客户以及成单信息;采集所述成单企业客户的用户行为日志数据,并结合商业接口数据,对所述用户行为日志数据进行清洗和标签化处理,得到所述成单企业客户的标签数据,写入标签数据表中,所述标签数据表包含了所述成单企业客户所有的公开信息数据标签和行为数据标签。3.根据权利要求2所述的复购商机挖掘方法,其特征在于,还包括,从所述客户信息表中随机抽取客户信息生成训练数据集,构建复购预测模型,并从所述客户信息表中随机抽取有复购行为的客户信息生成测试数据集,进行所述复购预测模型的验证。4.根据权利要求2所述的复购商机挖掘方法,其特征在于,所述对企业客户的特征数据进行处理的步骤,还包括,通过离散值η来衡量企业客户特征数据对复购决策的影响;所述离散值η的计算公式为:其中,P
i
为复购客户群体在特征数据的n个特征值上的统计值,Q
i
为未复购客户群体在特征数据的n个特征值上的统计值,n为正整数;将计算后的所述离散值进行排序,根据排序结果从所述成单企业客户的行为数据中选择所述行为数据的特征数据,从所述公开信息数据中选择企业公开信息数据的特征数据。5.根据权利要求1所述的复购商机挖掘方法,其特征在于,所述采用随机森林算法构建复购预测模型的步骤,还包括,构建所述复购...

【专利技术属性】
技术研发人员:侯丕然张国其冯高祥
申请(专利权)人:汉唐信通北京咨询股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1