System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于数据挖掘和推荐,特别是涉及一种面向多行为稀疏数据的客户转化率预测方法。
技术介绍
1、随着互联网的飞速发展,电子商务已经成为现代经济的重要组成部分。全球范围内,越来越多的消费者选择在线购物,电商平台的交易额和客户数量持续攀升。在这个数字化转型的过程中,客户的购买行为成为衡量电商平台成功的重要指标。为了提升销售额和客户满意度,电商平台需要深入了解客户行为及其背后的动机,特别是影响客户从浏览商品到最终购买的各种因素。转化率(cvr,conversion rate)预测技术应运而生,通过分析和建模客户行为数据,帮助平台更精准地预测客户购买的可能性,从而优化营销策略和客户体验。
2、基于深度神经网络的模型已经广泛应用于转化率预测,现有的方法主要分为两大类。第一类基于客户特征信息的序列数据,对客户行为建模进行转化率预测。这类方法的核心思想是利用客户的历史行为数据,特别是时序信息,来捕捉客户在不同时间点的行为模式和偏好,从而提高预测的准确性。第二类方法关注客户特征与物品(如广告、商品)特征之间的交互关系,利用这些交互特征进行预测,其核心思想是通过挖掘客户与物品特征之间的复杂关系,捕捉影响转化率的关键因素。
3、然而,深度学习模型通常需要大量的训练数据。在在线广告系统中,尽管可能存在数百万到数十亿的广告,但客户通常只会点击少部分广告,并在更小的集合上产生转化。这种数据稀疏性问题限制了深度模型的预测能力。此外,还有几个关键问题进一步影响转化率预测的精度和效果。首先是转化样本稀疏问题,正样本过少导致模型训练不
技术实现思路
1、本专利技术实施例的目的在于提供一种面向多行为稀疏数据的客户转化率预测方法,以优化节点的嵌入表示,增强对客户兴趣的建模能力,有效识别因转化延迟导致的假负样本问题。
2、为解决上述技术问题,本专利技术提供了一种面向多行为稀疏数据的客户转化率预测方法,按照以下步骤进行:
3、步骤s1:数据预处理,获取客户行为数据集,构建客户特征信息的序列数据,并按照每一条记录中的客户编号、项目编号、是否点击和是否发生转换构建点击和转化客户-项目交互图数据;
4、步骤s2:定义转换率预测模型cf4cvr,包括构建转化率预测模型cf4cvr和任务定义,所述任务是通过客户-项目特征信息s,客户集合u,项目集合v以及多行为的交互图a1,a2来预测发生点击和转换的概率;
5、步骤s3、使用s2中构建的客户-项目特征信息s,客户集合u,项目集合v以及多行为的交互图a1,a2的数据集对cf4cvr模型进行训练并保存训练权重;
6、步骤s4、模型加载和预测,声明cf4cvr模型并加载训练权重,将客户输入到模型cf4cvr中,计算客户和其他项目发生转化的概率。
7、进一步的,所述步骤s1的客户行为数据集包括客户编号、项目编号、是否点击、是否发生购买行为的转换、项目类别、客户性别、工作、地点和年龄。
8、进一步的,所述步骤s2的转化率预测模型cf4cvr,包括seqpredict模型和graphpredict模型,seqpredict模型包含输入嵌入层、字段池化层、多层感知机,通过归一化模块组成进行转化率预测和点击率预测;graphpredict模型包含输入嵌入层、邻居增强的图卷积网络、多任务学习模块、级联结构的跨行为建模模块和对比学习模块。
9、进一步的,所述步骤s3具体过程如下:
10、步骤s31、seqpredict模型使用客户特征数据进行预测:输入seqpredict模型的嵌入层和字段池化层将客户特征信息的序列数据映射为向量并拼接后表示为x∈[n,d];
11、其中,n表示记录数,d表示嵌入的维数,x表示从特征空间采用的特征嵌入向量;
12、进而,将向量经过多个线性层和非线性激活函数后进行归一化得到seqpredict模型发生点击概率和转换的概率
13、步骤s32、graphpredict模型使用客户-项目图结构数据进行预测,具体过程如下:
14、使用图卷积网络,通过对节点进行轻量级的更新操作,聚集单行为图内客户项目的高阶邻居信息,并对不同层的输出进行求和取平均的操作来优化节点嵌入表示,具体的:
15、
16、
17、其中fagg()为聚集函数,nu,k表示节点u在行为图ak下的邻居,表示客户u在图ak下第l层的嵌入表示,表示项目i在图ak下第l-1层的嵌入表,e'u,k为对不同层进行平均池化后的最终表示,l=0表示第0层,l表示图卷积网络的层数;
18、进而,考虑到客户交互的稀疏性,缺少足够的邻居信息和客户监督信息,无法有效的对客户偏好进行学习,本专利技术中图卷积网络一共三层,包括输入、隐藏、输出层,将其他两层的嵌入作为当前层嵌入的邻居信息并作为正样本进行对比学习,用于加强客户的监督信号。具体的说,同一节点在当前层和其他层的嵌入表示作为正样本,具体的:
19、
20、表示在行为图ak下客户u在第l层的表示,表示行为图ak下项目i在第l层的表示,τ是温度系数,表示在行为图ak下客户v在图卷积网络下第0层的嵌入,表示在行为图ak下项目i在图卷积网络下第0层的嵌入表示,表示在行为图ak下项目j在图卷积网络下第0层的嵌入表示,表示在行为图ak下客户u在第0层的表示,表示通过邻居增强方法和项目集合v在行为图ak计算出来的损失,表示通过邻居增强方法和客户集合u在行为图ak计算出来的损失,表示在行为图ak通过邻居增强方法计算出的损失;∑u∈u和∑v∈u表示对客户集合u进行遍历求和,其中u∈u和v∈u表示u和v是属于u的一个项目,∑i∈v和∑j∈v表示对项目集合v进行遍历求和,其中i∈v和j∈v表示i和j是属于v的一个项目;
21、进而,为了充分利用辅助行为中的客户偏好特征并缓解目标行为中的数据稀疏性,对客户的级联行为进行跨行为建模,当前行为图下的客户偏好输出和前一个行为图下的客户偏好进行求和操作作为当前行为图下的最终输出:
22、eu,k=eu,k-1+e′u,k,ei,k=ei,k-1+e′i,k
23、其中,eu,k-1和ei,k-1分别表示节点u,项目i在行为图ak-1下的表示,e'u,k和e'i,k分别表示节点u,项目i在行为图ak的输出,eu,k,ei,k为在行为图ak下客户-项目的最终嵌入表示;
24、进而,由于转化延迟现象导致假负样本问题,设计了一个对比学习模块,将点击行为学习到的客户和项目的嵌入表示与转换下的客户和项目的嵌入表示进行联合优化,具体的:
25、
...【技术保护点】
1.一种面向多行为稀疏数据的客户转化率预测方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种面向多行为稀疏数据的客户转化率预测方法,其特征在于,步骤S1所述客户行为数据集包括客户编号、项目编号、是否点击、是否发生购买行为的转换、项目类别、客户性别、工作、地点和年龄。
3.根据权利要求1所述的一种面向多行为稀疏数据的客户转化率预测方法,其特征在于,所述转化率预测模型CF4CVR,包括SeqPredict模型和GraphPredict模型,所述SeqPredict模型包含输入嵌入层、字段池化层、多层感知机,通过归一化模块组成进行转化率预测和点击率预测;所述GraphPredict模型包含输入嵌入层、邻居增强的图卷积网络、多任务学习模块、级联结构的跨行为建模模块和对比学习模块。
4.根据权利要求1所述的一种面向多行为稀疏数据的客户转化率预测方法,其特征在于,所述步骤S3具体过程如下:
5.根据权利要求4所述的一种面向多行为稀疏数据的客户转化率预测方法,其特征在于,所述图卷积网络包括输入、隐藏、输出层,将其他两层的嵌入作为当前层
...【技术特征摘要】
1.一种面向多行为稀疏数据的客户转化率预测方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种面向多行为稀疏数据的客户转化率预测方法,其特征在于,步骤s1所述客户行为数据集包括客户编号、项目编号、是否点击、是否发生购买行为的转换、项目类别、客户性别、工作、地点和年龄。
3.根据权利要求1所述的一种面向多行为稀疏数据的客户转化率预测方法,其特征在于,所述转化率预测模型cf4cvr,包括seqpredict模型和graphpredict模型,所述seqpredict模型包含输入嵌入层、字段池化层、多层感知机,通...
【专利技术属性】
技术研发人员:张璇,蔡玮,杜鲲鹏,王旭,谢绍衡,陈江彬,
申请(专利权)人:云南大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。