决策模型训练方法及样本特征选择方法、装置和电子设备制造方法及图纸

技术编号:23344784 阅读:30 留言:0更新日期:2020-02-15 04:21
本说明书实施例公开了一种决策模型训练方法及样本特征选择方法、装置和电子设备,该方法包括:确定目标产品在全链路分析时转化结果存在异常的问题节点,然后,将基于该问题节点确定的多个单维数据特征进行组合得到多个组合特征,一个组合特征中包括至少一个单维数据特征;基于包含多个组合特征的样本数据和对应的转化结果指示标签,按照预设决策模型进行训练得到第一权重集合;从该第一权重集合中选择权重贡献大于第一阈值的组合特征作为预设决策模型的样本特征。

Decision model training method and sample feature selection method, device and electronic equipment

【技术实现步骤摘要】
决策模型训练方法及样本特征选择方法、装置和电子设备
本说明书涉及计算机软件
,尤其涉及一种决策模型训练方法及样本特征选择方法、装置和电子设备。
技术介绍
全链路分析是当前分析网络产品的主要手段之一,通过对用户行为进行阶段划分,可视化展示每个阶段的转化情况,然后对转化有问题的节点进行下钻细分,定位影响该节点转化情况的问题。在传统的全链路下钻细分时,由于人工局限以及过分依赖人工历史经验,导致下钻细分的维度覆盖不全面,无法产出稳定、准确的分析结果。
技术实现思路
本说明书实施例的目的是提供一种决策模型训练方法及样本特征选择方法、装置和电子设备,用以准确、全面的选择决策模型的样本特征进而准确、稳定地定位全链路分析中存在异常的问题特征。为解决上述技术问题,本说明书实施例是这样实现的:第一方面,提出了一种决策模型的样本特征选择方法,包括:确定目标产品在全链路分析时转化结果存在异常的问题节点;将基于所述问题节点确定的多个单维数据特征进行组合,得到多个组合特征;其中,一个组合特征中包括至少一个单本文档来自技高网...

【技术保护点】
1.一种决策模型的样本特征选择方法,包括:/n确定目标产品在全链路分析时转化结果存在异常的问题节点;/n将基于所述问题节点确定的多个单维数据特征进行组合,得到多个组合特征;其中,一个组合特征中包括至少一个单维数据特征;/n基于包含所述多个组合特征的样本数据和对应的转化结果指示标签,按照预设决策模型进行训练,得到第一权重集合;/n基于所述第一权重集合,选择权重贡献大于第一阈值的组合特征作为所述预设决策模型的样本特征。/n

【技术特征摘要】
1.一种决策模型的样本特征选择方法,包括:
确定目标产品在全链路分析时转化结果存在异常的问题节点;
将基于所述问题节点确定的多个单维数据特征进行组合,得到多个组合特征;其中,一个组合特征中包括至少一个单维数据特征;
基于包含所述多个组合特征的样本数据和对应的转化结果指示标签,按照预设决策模型进行训练,得到第一权重集合;
基于所述第一权重集合,选择权重贡献大于第一阈值的组合特征作为所述预设决策模型的样本特征。


2.如权利要求1所述的方法,将基于所述问题节点确定的多个单维数据特征进行组合,得到多个组合特征,具体包括:
基于所述问题节点确定多个单维数据特征以及所述多个单维数据特征的总维数;
基于所述总维数将所述多个单维数据特征进行多维交叉组合,得到多个组合特征。


3.如权利要求2所述的方法,所述总维数为n,所述n为大于1的正整数;
基于所述总维数将所述多个单维数据特征进行多维交叉组合,得到多个组合特征,具体包括:
将所述多个单维数据特征分别进行N维交叉组合,其中,所述N依次取1至n之间的正整数;
统计1至n维下的组合特征,得到多个组合特征。


4.如权利要求2所述的方法,基于所述总维数将所述多个单维数据特征进行多维交叉组合,得到多个组合特征,具体包括:
基于所述总维数,按照预设交叉组合配置信息对所述多个单维数据特征进行多维交叉组合,统计得到多个组合特征。


5.如权利要求2所述的方法,基于所述问题节点确定多个单维数据特征以及所述多个单维数据特征的总维数,具体包括:
从所述问题节点提取原始数据特征,以及基于提取的所述原始数据特征统计得到的补充数据特征;
基于所述原始数据特征和所述补充数据特征确定多个单维数据特征;
基于所述原始数据特征的维度以及所述补充数据特征的维度,确定所述多个单维数据特征的总维数。


6.如权利要求5所述的方法,从所述问题节点提取原始数据特征,具体包括:
从所述问题节点采集用户行为数据;
基于所述用户行为数据提取原始数据特征。


7.如权利要求1所述的方法,基于所述第一权重集合,选择权重贡献大于第一阈值的组合特征作为所述预设决策模型的样本特征,具体包括:
基于所述第一权重集合,选择权重贡献大于第一阈值的组合特征;
基于包含选择的组合特征的样本数据以及对应的转化结果指示标签,按照所述预设决策模型进行迭代训练,得到第二权重集合;
如果同一组合特征在所述第二权重集合中的权重与在所述第一权重集合中的权重相比,波动不大于第二阈值,则确定权重贡献大于第一阈值的组合特征作为所述预设决策模型的样本特征。


8.如权利要求1所述的方法,确定目标产品在全链路分析时转化结果存在异常的问题节点,具体包括:
基于用户行为对目标产品的全链路进行节点划分,其中,不同节点用于表征用户行为在全链路中的不同行为阶段;
可视化所述节点的转化结果;
基于所述转化结果确定目标产品在全链路分析时转化结果存在异常的问题节点。


9.一种决策模型的训练方法,包括:
确定目标产品在全链路分析时转化结果存在异常的问题节点;
将基于所述问题节点确定的多个单维数据特征进行组合,得到多个组合特征;其中,一个组合特征中包括至少一个单维数据特征;
基于包含所述多个组合特征的样本数据和对应的转化结果指示标签,按照预设决策模型进行训练,得到第一权重集合;
基于所述第一权重集合,选择权重贡献大于第一阈值的组合特征作为所述预设决策模型的样本特征;
获取包含所述样本特征的样本数据和对应的转化结果指示标签;
基于获取的样本数据以及对应的指示标签训练所述预设决策模型。


10.一种决策模型的样本特征选择装置,包括:
确定模块,确定目标产品在全链路分析时转化结果存在异常的问题节点;
组合模块,将基于所述问题节点确定的多个单维数据...

【专利技术属性】
技术研发人员:王朝阳
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1