转化率预估方法、装置、电子设备及存储介质制造方法及图纸

技术编号：23432239 阅读：10 留言：0更新日期：2020-02-25 13:21

本申请实施例公开了一种转化率预估方法、装置、电子设备及存储介质，该方法包括：针对每个用户，分别按照时间顺序，从用户的历史行为数据中提取出针对商家的纯点击序列段、点击并下单序列段和纯下单序列段；根据每个用户对应的纯点击序列段、点击并下单序列段和纯下单序列段，确定训练样本集；根据训练样本集对词向量模型进行训练，得到词嵌入矩阵；根据词嵌入矩阵确定当前商家对应的词嵌入向量；确定当前用户的历史行为数据所针对的历史商家，并确定历史商家对应的词嵌入向量；根据当前商家对应的词嵌入向量和历史商家对应的词嵌入向量，预估当前用户对当前商家的转化率。本申请实施例较适用于高频使用的场景中，提高了转化率预估结果的精确度。

Conversion rate prediction method, device, electronic equipment and storage medium

全部详细技术资料下载

【技术实现步骤摘要】
转化率预估方法、装置、电子设备及存储介质
本申请的实施例涉及互联网
，特别是涉及一种转化率预估方法、装置、电子设备及存储介质。
技术介绍
现有技术中，应用词嵌入向量预估转化率时，一般应用用户的点击序列，来训练词嵌入向量，并使用该词嵌入向量来预估转化率。由于只使用用户的点击序列作为训练语料，不适用于高频使用的场景中，在高频使用的场景中，转化率预估的结果精确度较低。
技术实现思路
本申请实施例提供一种转化率预估方法、装置、电子设备及存储介质，以提高转化率预估结果的精确度。为了解决上述问题，第一方面，本申请实施例提供了一种转化率预估方法，包括：针对每个用户，分别按照时间顺序，从用户的历史行为数据中提取出针对商家的纯点击序列段、点击并下单序列段和纯下单序列段；根据每个用户对应的所述纯点击序列段、点击并下单序列段和纯下单序列段，确定训练词嵌入矩阵的训练样本集；根据所述训练样本集，对词向量模型进行训练，得到词嵌入矩阵；根据所述词嵌入矩阵，确定当前商家对应的词嵌入向量；确定当前用户的历史行为数据所针对的历史商家，并根据所述词嵌入矩阵，确定所述历史商家对应的词嵌入向量；根据所述当前商家对应的词嵌入向量和所述历史商家对应的词嵌入向量，预估所述当前用户对所述当前商家的转化率。第二方面，本申请实施例提供了一种转化率预估装置，包括：序列提取模块，用于针对每个用户，分别按照时间顺序，从用户的历史行为数据中提取出针对商家的纯点击序列段、点击...

【技术保护点】
1.一种转化率预估方法，其特征在于，包括：/n针对每个用户，分别按照时间顺序，从用户的历史行为数据中提取出针对商家的纯点击序列段、点击并下单序列段和纯下单序列段；/n根据每个用户对应的所述纯点击序列段、点击并下单序列段和纯下单序列段，确定训练词嵌入矩阵的训练样本集；/n根据所述训练样本集，对词向量模型进行训练，得到词嵌入矩阵；/n根据所述词嵌入矩阵，确定当前商家对应的词嵌入向量；/n确定当前用户的历史行为数据所针对的历史商家，并根据所述词嵌入矩阵，确定所述历史商家对应的词嵌入向量；/n根据所述当前商家对应的词嵌入向量和所述历史商家对应的词嵌入向量，预估所述当前用户对所述当前商家的转化率。/n

【技术特征摘要】
1.一种转化率预估方法，其特征在于，包括：
针对每个用户，分别按照时间顺序，从用户的历史行为数据中提取出针对商家的纯点击序列段、点击并下单序列段和纯下单序列段；
根据每个用户对应的所述纯点击序列段、点击并下单序列段和纯下单序列段，确定训练词嵌入矩阵的训练样本集；
根据所述训练样本集，对词向量模型进行训练，得到词嵌入矩阵；
根据所述词嵌入矩阵，确定当前商家对应的词嵌入向量；
确定当前用户的历史行为数据所针对的历史商家，并根据所述词嵌入矩阵，确定所述历史商家对应的词嵌入向量；
根据所述当前商家对应的词嵌入向量和所述历史商家对应的词嵌入向量，预估所述当前用户对所述当前商家的转化率。

2.根据权利要求1所述的方法，其特征在于，所述针对每个用户，分别按照时间顺序，从用户的历史行为数据中提取出针对商家的纯点击序列段、点击并下单序列段和纯下单序列段，包括：
确定当前处理用户；
获取所述当前处理用户的历史行为数据；
按照时间顺序，从所述历史行为数据中提取出所述当前处理用户针对商家的行为序列；
根据所述行为序列，确定下单行为对应的下单序列；
按照第一预设时间间隔和下单行为，分别对所述行为序列进行截断，以将所述行为序列分割为纯点击序列段和点击并下单序列段；
按照第二预设时间间隔，对所述下单序列进行截断，以将所述下单序列分割为纯下单序列段；
循环执行上述确定当前处理用户和分割行为序列及下单序列的操作，直至得到每个用户对应的纯点击序列段、点击并下单序列段和纯下单序列段。

3.根据权利要求1所述的方法，其特征在于，所述根据每个用户对应的所述纯点击序列段、点击并下单序列段和纯下单序列段，确定训练词嵌入矩阵的训练样本集，包括：
根据所述纯点击序列段生成第一训练样本，根据所述点击并下单序列段生成第二训练样本，根据所述纯下单序列段生成第三训练样本；
针对每个用户，分别混合所述第一训练样本、第二训练样本和第三训练样本，得到训练词嵌入矩阵的训练样本集。

4.根据权利要求3所述的方法，其特征在于，所述根据所述纯点击序列段生成第一训练样本，根据所述点击并下单序列段生成第二训练样本，根据所述纯下单序列段生成第三训练样本，包括：
根据所述纯点击序列段，使用Skip-Gram模型和负采样生成第一训练样本；
根据所述点击并下单序列段，使用Skip-Gram模型和负采样生成第二训练样本；
根据所述纯下单序列段，使用Skip-Gram模型和负采样生成第三训练样本。

5.根据权利要求4所述的方法，其特征在于，采用所述第一训练样本训练所述词向量模型时使用的第一损失函数表示如下：

其中，Loss1为第一损失函数，Dp1为第一训练样本中中心词l1与正样本c1组成的样本对的集合，Dn1为第一训练样本中中心词l1与负采样词d1组成的样本对的集合，vl1是中心词l1对应的词嵌入向量，vc1是正样本c1对应的词嵌入向量，v′c1是vc1的转置向量，vd1是负采样词d1对应的词嵌入向量，v′d1是vd1的转置向量，是指后面括号中的表达式取最大值时变量θ1的取值，θ1为变量，即指vl1、vc1和vd1；
采用所述第二训练样本训练所述词...

【专利技术属性】
技术研发人员：孙士元，谢乾龙，王兴星，王栋，
申请(专利权)人：北京三快在线科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人