基于随机森林的产品复投预测方法、装置、设备及介质制造方法及图纸

技术编号:31748793 阅读:21 留言:0更新日期:2022-01-05 16:29
本发明专利技术实施例公开了一种基于随机森林的产品复投预测方法、装置、设备及介质。本发明专利技术涉及人工智能技术领域,其包括:从预设数据库中获取客户的复投特征数据,并通过数据清洗及数据归一化方法对复投特征数据进行预处理;对预处理后的任意两个复投特征数据进行相关性计算以得到相关系数,并根据相关系数将满足预设条件的复投特征数据作为目标数据集;将目标数据集分为训练数据集及验证数据集,分别用于Scikit

【技术实现步骤摘要】
基于随机森林的产品复投预测方法、装置、设备及介质


[0001]本专利技术涉及人工智能
,尤其涉及一种基于随机森林的产品复投预测方法、装置、设备及介质。

技术介绍

[0002]针对客户回款的业务场景,通常会在客户回款前进行运营,现有技术中,基于对客户、复投产品以及交易数据的统计分析,使用机器学习及人工两种方式进行回款运营,例如人工电话、智能AI外呼、弹窗提示,铺垫性的推荐产品和视频等,但运营效率及客户回款后复投概率还是比较低,复投数据预测的准确度不高。

技术实现思路

[0003]本专利技术实施例提供了一种基于随机森林的产品复投预测方法、装置、设备及介质,旨在解决现有复投数据预测的准确度不高的问题。
[0004]第一方面,本专利技术实施例提供了一种基于随机森林的产品复投预测方法,其包括:
[0005]从预设数据库中获取客户的复投特征数据,并通过数据清洗及数据归一化方法对所述复投特征数据进行预处理,其中,所述复投特征数据包括固定复投特征数据及交互复投特征数据;
[0006]对预处理后的任意两个所述复投特征本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于随机森林的产品复投预测方法,其特征在于,包括:从预设数据库中获取客户的复投特征数据,并通过数据清洗及数据归一化方法对所述复投特征数据进行预处理,其中,所述复投特征数据包括固定复投特征数据及交互复投特征数据;对预处理后的任意两个所述复投特征数据进行相关性计算以得到相关系数,并根据所述相关系数将满足预设条件的所述复投特征数据作为目标数据集;根据所述目标数据集对Scikit

learn库中随机森林算法模型进行训练及评估以得到复投决策模型;接收客户端发送的客户复投特征数据,并根据所述客户复投特征数据及所述复投决策模型预测与所述客户复投特征数据相对应的复投率。2.根据权利要求1所述的方法,其特征在于,所述通过数据清洗及数据归一化方法对所述复投特征数据进行预处理,包括:对所述复投特征数据进行缺失值填充及异常值处理以得到第一复投特征数据;对所述第一复投特征数据进行归一化处理以得到第二复投特征数据,将所述第二复投特征数据作为预处理后的所述复投特征数据。3.根据权利要求1所述的方法,其特征在于,所述对预处理后的任意两个所述复投特征数据进行相关性计算以得到相关系数,并根据所述相关系数将满足预设条件的所述复投特征数据作为目标数据集,包括:调用pandas库中的corr函数对预处理后的任意两个所述复投特征数据进行相关性计算以得到相关系数;筛选出数值大于预设值的相关系数作为目标对象,并计算所述目标对象在总的所述相关系数中的占比以得到相关比值;判断所述相关比值是否大于预设比值;若所述相关比值大于所述预设比值,则将所述目标对象对应的复投特征数据作为目标数据集。4.根据权利要求3所述的方法,其特征在于,所述判断所述相关比值是否大于预设比值之后,还包括:若所述相关比值不大于所述预设比值,则将所述相关系数的值不大于预设系数值所对应的任意N列复投特征数据相加合并,以形成新的复投特征数据,并返回执行所述调用pandas库中的corr函数对预处理后的任意两个所述复投特征数据进行相关性计算以得到相关系数的步骤,其中,N为不小于2的任意数。5.根据权利要求1所述的方法,其特征在于,所述根据所述目标数据集对Scikit

learn库中随机森林算法模型进行训练及评估以得到复投决策模型,包括:将所述目标数据集按预设比例分为训练数据集及验证数据集;将所述训练数据集输入Scikit

learn库中的随机森林算法模型进行训练直到预设训练次数为止;将所述验证数据集输入训练后的所述随机森林算法模型以得到复投预测结果;将所述复投预测结果与...

【专利技术属性】
技术研发人员:刘涛
申请(专利权)人:未鲲上海科技服务有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1