一种针对阶梯模型的数据处理方法、装置以及电子设备制造方法及图纸

技术编号：17139700 阅读：35 留言：0更新日期：2018-01-27 15:08

本说明书实施例公开了一种针对阶梯模型的数据处理方法、装置以及电子设备。所述方法包括：利用预先训练得到的多个单权益模型及其分别对应的离线的训练数据，对基于这多个单权益模型构建的阶梯模型的用户圈定比例进行近似求解。

A data processing method, device, and electronic equipment for a ladder model

A data processing method, a device, and an electronic device for a ladder model are disclosed in the present specification. The method includes: using the multiple single interest models obtained from pre training and their corresponding off-line training data, the user delimitation proportion based on these multiple single interest models is solved approximately.

全部详细技术资料下载

【技术实现步骤摘要】
一种针对阶梯模型的数据处理方法、装置以及电子设备
本说明书涉及计算机软件
，尤其涉及一种针对阶梯模型的数据处理方法、装置以及电子设备。
技术介绍
随着计算机和互联网技术的迅速发展，很多业务可以在网上进行，给用户带来了便利。为了更好地服务于用户，业务提供方经常需要进行活动运营，一般通过向用户投放权益，以求实现对用户的拉新、留存、促活或者召回流失(为了便于描述，可以统称为：用户转化)，该权益比如可以是话费、购物优惠券、现金红包、游戏虚拟物品等。以拉新为例，若某用户由于自己被投放的权益，成为了进行拉新的投放方的新用户，则认为该用户被转化，反之则认为该用户未被转化。在一定的成本预算下，使尽量多的用户被转化即是投放方的主要目标。在现有技术中，会训练得到多个单权益模型，单权益模型用于根据用户特征计算该用户对于单个权益的接受度，一般地，接受度越高表示该用户在被投放该单个权益的情况下越有可能被转化；进一步地，在实际应用中，多个单权益模型分别对应的权益可能具有包含关系(比如，某三种权益可能分别是2元话费、5元话费、10元话费，则10话费是包含2元话费、5元话费的，5元话费又是...
一种针对阶梯模型的数据处理方法、装置以及电子设备

【技术保护点】
一种针对阶梯模型的数据处理方法，包括：获取预先训练得到的多个单权益模型及其分别对应的离线的训练数据，所述单权益模型用于计算用户对于单个权益的接受度；构建阶梯模型，所述阶梯模型表示所述多个单权益模型将按照一定的模型优先级顺序和所述接受度，分别从待投放权益的用户集合中圈定部分用户；根据所述离线的训练数据，对所述单权益模型针对所述用户集合的用户圈定比例进行近似求解，以便于基于所述阶梯模型向用户投放权益。

【技术特征摘要】
1.一种针对阶梯模型的数据处理方法，包括：获取预先训练得到的多个单权益模型及其分别对应的离线的训练数据，所述单权益模型用于计算用户对于单个权益的接受度；构建阶梯模型，所述阶梯模型表示所述多个单权益模型将按照一定的模型优先级顺序和所述接受度，分别从待投放权益的用户集合中圈定部分用户；根据所述离线的训练数据，对所述单权益模型针对所述用户集合的用户圈定比例进行近似求解，以便于基于所述阶梯模型向用户投放权益。2.如权利要求1所述的方法，所述根据所述离线的训练数据，对所述单权益模型针对所述用户集合的用户圈定比例进行近似求解，具体包括：根据所述多个单权益模型中的每个单权益模型对应的离线的训练数据，计算该训练数据对应的用户对于该单权益模型对应的权益的接受度；分别针对所述每个单权益模型计算的所述接受度进行排序，以及根据排序结果划分出设定数量个接受度取值区间；根据所述接受度取值区间，对所述单权益模型针对所述用户集合的用户圈定比例进行近似求解。3.如权利要求2所述的方法，所述离线的训练数据包括用于输入所述单权益模型的用户特征，以及对该单权益模型的目标输出，所述目标输出表示：该用户特征所属的用户在被投放该单权益模型对应的权益后，被转化还是未被转化；所述根据所述接受度取值区间，对所述单权益模型针对所述用户集合的用户圈定比例进行近似求解，具体包括：根据每个所述接受度取值区间及其对应的离线的训练数据，计算该接受度取值区间的区间内用户转化率；基于特定条件，枚举多种用户圈定比例方案，并根据所述区间内用户转化率、预定的待投放权益总量和用户转化目标，从所述多种用户圈定比例方案中选择至少一种用户圈定比例方案，作为对所述单权益模型针对所述用户集合的用户圈定比例的近似求解结果；所述特定条件为：其中，k为所述单权益模型的数量，Q等于所述设定数量，segi为非负整数，为第i个所述单权益模型针对所述用户集合的用户圈定比例。4.如权利要求3所述的方法，所述多个单权益模型分别对应的单个权益之间具有包含关系；被包含的权益对应的单权益模型的模型优先级高于包含该权益的权益对应的单权益模型的模型优先级。5.如权利要求4所述的方法，所述根据所述区间内用户转化率、预定的待投放权益总量和用户转化目标，从所述多种用户圈定比例方案中选择至少一种用户圈定比例方案，具体包括：分别针对所述多种用户圈定比例方案中的每种用户圈定比例方案，执行：确定所述多个单权益模型中的每个单权益模型对应的离线的训练数据；分别针对所述每个单权益模型对应的离线的训练数据，根据该单权益模型对应计算出的接受度进行排序，并在排序后的训练数据中按照该用户圈定比例方案，圈定出各所述单权益模型对应圈定比例的训练数据块；根据所述区间内用户转化率，计算所述训练数据块的块内用户转化率；按照该用户圈定比例方案，利用所述多个单权益模型分别从所述用户集合中圈定部分用户，并根据所述块内用户转化率，估计圈定后的所述用户集合的用户转化量；根据预定的待投放权益总量和用户转化目标，以及分别对所述每种用户圈定比例方案估计的所述用户转化量，从所述多种用户圈定比例方案中选择至少一种用户圈定比例方案。6.如权利要求5所述的方法，所述根据所述区间内用户转化率，计算所述训练数据块的块内用户转化率，具体包括：分别在所述每个单权益模型对应的各所述训练数据块中，确定对应于该单权益模型对应圈定比例的训练数据块；分别在所述每个单权益模型对应的各所述接受度取值区间中，确定对应于该单权益模型对应圈定比例的训练数据块所属的接受度取值区间，以及计算所述确定的各接受度取值区间的区间内用户转化率的均值，作为对应于该单权益模型对应圈定比例的训练数据块的块内用户转化率。7.如权利要求5所述的方法，所述按照该用户圈定比例方案，利用所述多个单权益模型分别从所述用户集合中圈定部分用户，并根据所述块内用户转化率，估计圈定后的所述用户集合的用户转化量，具体包括：按照所述模型优先级和该用户圈定比例方案，分别采用所述多个单权益模型中的每个单权益模型，在所述用户集合中圈定符合该用户圈定比例方案的用户子集，其中，每次圈定前排除已被圈定的用户，以及利用当前要圈定的单权益模型对所述排除后剩余的用户计算所述接受度并排序，在圈定时优先圈定接受度高的用户；对于圈定所述用户子集的单权益模型，将该单权益模型对应圈定比例的训练数据块的块内用户转化率作为：该用户子集的子集内用户转化率；根据各所述用户子集的子集内用户转化率，估计圈定后的所述用户集合的用户转化量。8.一种针对阶梯模型的数据处理装置，包括：获取模块，获取预先训练得到的多个单权益模型及其分别对应的离线的训练数据，所述单权益模型用于计算用户对于单个权益的接受度；构建模块，构建阶梯模型，所述阶梯模型表示所述多个单权益模型将按照一定的模型优先级顺序和所述接受度，分别从待投放权益的用户集合中圈定部分用户；近似求解模块，根据所述离线的训练数据，对所述单权益模型针对所述用户集合的用户...

【专利技术属性】
技术研发人员：方文静，王力，周俊，高艳艳，
申请(专利权)人：阿里巴巴集团控股有限公司，
类型：发明
国别省市：开曼群岛,KY

全部详细技术资料下载我是这个专利的主人