订单质量评价模型训练方法、评价方法、装置和介质制造方法及图纸

技术编号:34136435 阅读:37 留言:0更新日期:2022-07-14 16:44
本发明专利技术提供一种订单质量评价模型训练方法、评价方法、装置和介质。该方法包括:根据移动互联网号卡订单数据,得到初始样本集,初始样本集包括用户的原始特征向量、转化率和首充数;根据初始样本集中的基础特征向量,得到混合样本集、异网用户样本集和本网用户样本集;基础特征向量为本网用户样本和异网用户样本共有的特征向量;根据混合样本集、异网用户样本集和本网用户样本集,构建并训练随机森林模型,得到训练好的随机森林模型,随机森林模型用于根据用户的特征向量输出转化率和首充数,转化率和首充数用于评价订单质量。本发明专利技术的方法,能够有效地、科学地,以及准确地进行互联网号卡订单评估。号卡订单评估。号卡订单评估。

Training method, evaluation method, device and medium of order quality evaluation model

【技术实现步骤摘要】
订单质量评价模型训练方法、评价方法、装置和介质


[0001]本专利技术涉及通信
,尤其涉及一种订单质量评价模型训练方法、评价方法、装置和介质。

技术介绍

[0002]运营商通过互联网渠道获取活动指标评分、业务指标评分或者用户价值预测可以将客户的数据进行一个合理的统计和质量划分,以便于更好地进行服务资源分配、二次营销等业务。
[0003]现有的相关技术方案有针对渠道的等级评估和用户价值的获取。在订单预测方面,目前运营商实际使用得较多的是预测订单是否属于恶意单;判定条件有联系电话虚假、30天内重复订单、配送地址黑名单等;如果发现是恶意单,则停止后续的订单流程。
[0004]但是,目前的技术方案的预测评估方法,功能相对单一,缺乏一定的有效性和科学性,难以准确地根据评估结果倾斜服务资源和对高质量用户做二次营销。

技术实现思路

[0005]本专利技术提供一种订单质量评价模型训练方法、评价方法、装置和介质,用以解决现有技术中功能相对单一,缺乏一定的有效性和科学性,难以准确地根据评估结果倾斜服务资源和对高质量用户做二次营本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种订单质量评价模型训练方法,其特征在于,包括:根据移动互联网号卡订单数据,得到初始样本集,所述初始样本集包括用户的原始特征向量、转化率和首充数,所述转化率为用于指示用户下单入网的概率,所述首充数为已入网用户首次充值量;根据所述初始样本集中的基础特征向量,得到混合样本集、异网用户样本集和本网用户样本集;所述基础特征向量为本网用户样本和异网用户样本共有的特征向量;根据所述混合样本集、所述异网用户样本集和所述本网用户样本集,构建并训练随机森林模型,得到训练好的随机森林模型,所述随机森林模型用于根据用户的特征向量输出转化率和首充数,所述转化率和所述首充数用于评价订单质量。2.根据权利要求1所述的方法,其特征在于,所述根据所述初始样本集中的基础特征向量,得到混合样本集、异网用户样本集和本网用户样本集,包括:选取初始样本集中的基础特征向量和转化率,构成所述混合样本集;筛选出初始样本集中仅包括异网用户数据的样本,并选取所述基础特征向量和首充数,构成所述异网用户样本集;筛选出初始样本集中仅包括本网用户数据的样本,并选取所述基础特征向量、本网特征向量和首充数,构成所述本网用户样本集。3.根据权利要求2所述的方法,其特征在于,所述基础特征向量包括:操作系统、介质信息、信息流媒体、用户信息、号卡信息以及订单信息;所述本网特征向量包括:用户入网时间、用户消费数据、预存数据以及欠费数据。4.根据权利要求1所述的方法,其特征在于,所述随机森林模型包括:混合随机森林模型、异网随机森林模型,以及本网随机森林模型;所述混合随机森林模型、异网随机森林模型,以及本网随机森林模型的构建和训练过程相同;其中,所述混合随机森林模型的训练数据为所述混合样本集,并将转化率作为输出进行训练;所述异网随机森林模型的训练数据为所述异网用户样本集,并将首充数作为输出进行训练;所述本网随机森林模型的样本数据为所述本网用户样本集,并将首充数作为输出进行训练。5.根据权利要求4所述的方法,其特征在于,目标随机森林模型的构建和训练过程包括:S1

1、从所述混合样本集中随机有放回地取出N个样本,重复n次,得到n个训练样本集;S1

2、基于所述n个训练样本集,分别训练n个回归决策树模型;S1

3、选取一个回归决策树模型以及常数m,所述常数m为小于混合样本集总特征向量种类数目的整数;S1

4、随机地从所述混合样本集的总特征向量中选取m种特征向量,作为特征子集;S1

5、遍历特征子集中的所有特征向量,对每个特征向量进行二元切分,并计算每个特征向量分裂后的两组数据对应的目标数据的均值和目标数据的均方误差;S1

6、比较所有目标数据的均方误差,选取两个目标数据的均方误差最小的数组,得到第一次二分裂的两个数组;所述数组中的数据包括特征向量类型、样本数、目标数据的均值和目标数据的均方误差;
S1

7、返回步骤S1

5,重复遍历直到回归决策树分裂的叶子节点对应的目标数据的均方误差为0;S1

8、将所有分裂好的回归决策树组合成一个初始目标随机森林模型,计算初始目...

【专利技术属性】
技术研发人员:胡家光黄锐志王健王俊杰杨迪
申请(专利权)人:中国联合网络通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1