链路转化数据处理方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:39297097 阅读:11 留言:0更新日期:2023-11-07 11:05
本申请涉及一种链路转化数据处理方法、装置、计算机设备、存储介质和计算机程序产品。方法包括:获取链路转化样本的对象侧描述数据和供给侧描述数据;对对象侧描述数据和供给侧描述数据分别进行特征提取处理,得到对象侧特征数据和供给侧特征数据;对对象侧特征数据和供给侧特征数据进行特征交叉处理,得到链路转化特征数据;基于链路转化特征数据确定链路转化样本的实际转化概率和转化周期;基于实际转化概率,按照转化周期进行转化概率预测处理,确定链路转化样本在转化周期内的样本转化概率。本申请通过在样本的概率中加入转化周期,可以解决将当前未转化但是将来会转化的正样本标记为负样本的问题,提高转化链路分析模型的准确性。确性。确性。

【技术实现步骤摘要】
链路转化数据处理方法、装置、计算机设备和存储介质


[0001]本申请涉及计算机
,特别是涉及一种链路转化数据方法、装置、计算机设备、存储介质和计算机程序产品。

技术介绍

[0002]随着计算机技术的发展,出现了转化链路分析技术,转化链路指的是从某个渠道进入产品后,通过一系列的页面和操作,最终完成目标转化的路径。在设计转化链路时,需要考虑许多因素,包括用户体验、产品流量、目标转化等。而延迟转化,也被称为延迟反馈(Delayed Feedback)是转化链路分析的重要一环,它是指在很多实际场景中,样本的标签往往不能在被观察或者被收集的时刻确认,或者说样本收集和标签确认之间经常存在延迟,即反馈延迟。
[0003]目前,在进入产品后的后链路转化分析中,收集正样本率相对较低,而延迟反馈严重又使得很多正样本在收集时被标记为负样本,很大程度地影响了转化链路分析模型的训练效果,从而降低了转化链路分析模型的准确性。

技术实现思路

[0004]基于此,有必要针对上述技术问题,提供一种能够有效提高链路分析中样本数据有效性的链路转化数据处理方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
[0005]第一方面,本申请提供了一种链路转化数据处理方法。所述方法包括:
[0006]获取链路转化样本的对象侧描述数据和供给侧描述数据;
[0007]对所述对象侧描述数据和供给侧描述数据分别进行特征提取处理,得到对象侧特征数据和供给侧特征数据;
[0008]对所述对象侧特征数据和所述供给侧特征数据进行特征交叉处理,得到链路转化特征数据;
[0009]基于所述链路转化特征数据确定所述链路转化样本的实际转化概率和转化周期;
[0010]基于所述实际转化概率,按照所述转化周期进行转化概率预测处理,确定所述链路转化样本在所述转化周期内的样本转化概率。
[0011]第二方面,本申请还提供了一种链路转化数据处理装置。所述装置包括:
[0012]数据获取模块,用于获取链路转化样本的对象侧描述数据和供给侧描述数据;
[0013]特征提取模块,用于对所述对象侧描述数据和供给侧描述数据分别进行特征提取处理,得到对象侧特征数据和供给侧特征数据;
[0014]特征交叉模块,用于对所述对象侧特征数据和所述供给侧特征数据进行特征交叉处理,得到链路转化特征数据;
[0015]转化数据确定模块,用于基于所述链路转化特征数据确定所述链路转化样本的实际转化概率和转化周期;
[0016]概率预测模块,用于基于所述实际转化概率,按照所述转化周期进行转化概率预测处理,确定所述链路转化样本在所述转化周期内的样本转化概率。
[0017]第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
[0018]获取链路转化样本的对象侧描述数据和供给侧描述数据;
[0019]对所述对象侧描述数据和供给侧描述数据分别进行特征提取处理,得到对象侧特征数据和供给侧特征数据;
[0020]对所述对象侧特征数据和所述供给侧特征数据进行特征交叉处理,得到链路转化特征数据;
[0021]基于所述链路转化特征数据确定所述链路转化样本的实际转化概率和转化周期;
[0022]基于所述实际转化概率,按照所述转化周期进行转化概率预测处理,确定所述链路转化样本在所述转化周期内的样本转化概率。
[0023]第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
[0024]获取链路转化样本的对象侧描述数据和供给侧描述数据;
[0025]对所述对象侧描述数据和供给侧描述数据分别进行特征提取处理,得到对象侧特征数据和供给侧特征数据;
[0026]对所述对象侧特征数据和所述供给侧特征数据进行特征交叉处理,得到链路转化特征数据;
[0027]基于所述链路转化特征数据确定所述链路转化样本的实际转化概率和转化周期;
[0028]基于所述实际转化概率,按照所述转化周期进行转化概率预测处理,确定所述链路转化样本在所述转化周期内的样本转化概率。
[0029]第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
[0030]获取链路转化样本的对象侧描述数据和供给侧描述数据;
[0031]对所述对象侧描述数据和供给侧描述数据分别进行特征提取处理,得到对象侧特征数据和供给侧特征数据;
[0032]对所述对象侧特征数据和所述供给侧特征数据进行特征交叉处理,得到链路转化特征数据;
[0033]基于所述链路转化特征数据确定所述链路转化样本的实际转化概率和转化周期;
[0034]基于所述实际转化概率,按照所述转化周期进行转化概率预测处理,确定所述链路转化样本在所述转化周期内的样本转化概率。
[0035]上述链路转化数据处理方法、装置、计算机设备、存储介质和计算机程序产品,通过获取链路转化样本的对象侧描述数据和供给侧描述数据;并对对象侧描述数据和供给侧描述数据分别进行特征提取处理,得到对象侧特征数据和供给侧特征数据;从而从链路转化样本的对象侧和供给侧分别提取出可以用于进行链路转化预测的特征数据。并对对象侧特征数据和供给侧特征数据进行特征交叉处理,得到链路转化特征数据,从而提高样本特征的非线性建模能力。最后基于链路转化特征数据确定链路转化样本的实际转化概率和转化周期,通过分别对样本的转化概率和转化周期建模,将用户转化的概率问题拆解为两个
问题:用户的转化概率问题与用户的转化周期问题。最后基于实际转化概率,按照转化周期进行转化概率预测处理,确定链路转化样本在转化周期内的样本转化概率。基于对链路转化样本的实际转化概率建模和转化周期建模,来确定链路转化样本在转化周期内的样本转化概率。本申请在对链路转化样本的对象侧描述数据和供给侧描述数据进行特征提取和特征交叉后,通过对链路转化周期的建模,将链路转化样本的概率问题拆解为转化概率问题与转化周期问题,通过在样本的概率中加入转化周期,可以解决将当前未转化但是将来会转化的正样本标记为负样本的问题,提高转化链路分析模型的准确性。
附图说明
[0036]图1为一个实施例中链路转化数据处理方法的应用环境图;
[0037]图2为一个实施例中链路转化数据处理方法的流程示意图;
[0038]图3为一个实施例中流量链路转化过程的流程示意图;
[0039]图4为一个实施例中购买决策模型的示意图;
[0040]图5为一个实施例中消费者行为分析模型的示意图;
[0041]图6为一个实施例中转化漏斗模型的示意图;
[0042]图7为一个实施例中链路转化数据处理方法的流程框图;
[0043]图本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种链路转化数据处理方法,其特征在于,所述方法包括:获取链路转化样本的对象侧描述数据和供给侧描述数据;对所述对象侧描述数据和供给侧描述数据分别进行特征提取处理,得到对象侧特征数据和供给侧特征数据;对所述对象侧特征数据和所述供给侧特征数据进行特征交叉处理,得到链路转化特征数据;基于所述链路转化特征数据确定所述链路转化样本的实际转化概率和转化周期;基于所述实际转化概率,按照所述转化周期进行转化概率预测处理,确定所述链路转化样本在所述转化周期内的样本转化概率。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:识别所述对象侧描述数据和供给侧描述数据中的连续型数据;对所述连续型数据进行离散化处理;所述对所述对象侧描述数据和产品侧描述数据分别进行特征提取处理,得到对象侧特征数据和供给侧特征数据包括:对连续型数据离散化处理后的所述对象侧描述数据、以及连续型数据离散化处理后的所述供给侧描述数据分别进行特征提取处理,得到对象侧特征数据和供给侧特征数据。3.根据权利要求2所述的方法,其特征在于,所述对所述连续型数据进行离散化处理包括:查找所述连续型数据对应的离散化分桶方法;基于查找到的所述离散化分桶方法对所述连续型数据进行离散化处理。4.根据权利要求1所述的方法,其特征在于,所述对所述对象侧描述数据和供给侧描述数据分别进行特征提取处理,得到对象侧特征数据和供给侧特征数据包括:查找对象侧特征编码表,确定各项对象侧描述数据对应的特征编码,得到对象侧特征数据;查找供给侧特征编码表,确定各项供给侧描述数据对应的特征编码,得到供给侧特征数据。5.根据权利要求1所述的方法,其特征在于,所述对所述对象侧特征数据和所述供给侧特征数据进行特征交叉处理,得到链路转化特征数据包括:对所述对象侧特征数据和所述供给侧特征数据分别进行分域处理,确定对象侧特征域数据和供给侧特征域数据;通过域加权的域感知因子分解机模型,对所述对象侧特征域数据和供给侧特征域数据进行特征交叉处理,得到链路转化特征数据。6.根据权利要求1所述的方法,其特征在于,所述对所述对象侧描述数据和供给侧描述数据分别进行特征提取处理,得到对象侧特征数据和供给侧特征数据包括:对所述对象侧描述数据和供给侧描述数据进行特征归一化处理;对特征归一化处理后的对象侧描述数据、和特征归一化处理后的供给侧描述数据分别进行特征提取处理,得到对象侧特征数据和供给侧特征数据。7.根据权利要求1所述的方法,其特征在于,基于所述链路转化特征数据确定所述链路转化样本的转化周期包括:
基于所述链路转化样本的转化延迟,得到第一韦伯分布函数,基于所述链路转化样本的收集延迟,得到第二韦伯分布函数;基于所述第一韦伯分布函数和所述第二韦伯分布函数进行转化周期的概率...

【专利技术属性】
技术研发人员:周权
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1