列表排序方法、装置、电子设备及介质制造方法及图纸

技术编号:37458581 阅读:9 留言:0更新日期:2023-05-06 09:31
本发明专利技术提供了一种列表排序方法、装置、电子设备及介质,包括:获取待排序列表中的候选产品数据;将候选产品数据输入到预先训练好的购买率预测模型中,得到每个候选产品的购买率预估值;其中,购买率预测模型是基于去除偏差后的样本数据训练得到的;基于购买率预估值确定候选产品在待排序列表中的排序。本发明专利技术能够更加准确的反映用户的真实偏好,提高用户购买率。率。率。

【技术实现步骤摘要】
列表排序方法、装置、电子设备及介质


[0001]本专利技术涉及机器学习
,尤其是涉及一种列表排序方法、装置、电子设备及介质。

技术介绍

[0002]用户通过购物或者购票平台搜索产品信息时,通常曝光在用户面前的产品列表都是按照某种规则进行排序的结果。现有的个性化排序有两种方法,一是采用最小价或最多好评(依产品属性决定,在线旅游(Online TravelAgency,OTA)领域还有可能是最短耗时)等人工规则,二是采用一般的机器学习方法预测产品的购买率,收集在列表中的产品曝光、点击、购买数据,通过已知好坏标签(Know Good Bad,KGB)样本进行线上的KGB_CVR预估,对召回的列表按KGB_CVR预估值进行从大到小排列。CVR即Conversion Rate,一般称为转化率,KGB_CVR预估指完全采用已知的曝光后下单的数据训练得到模型,进而对全部候选集进行线上预估。三是采用已有的拒绝推断技术。但是,现有的排序方法中,样本数据存在偏差,无法挖掘出用户的真实偏好,从而导致用户购买率较低。

技术实现思路

[0003]有鉴于此,本专利技术的目的在于提供一种列表排序方法、装置、电子设备及介质,能够更加准确的反映用户的真实偏好,提高用户购买率。
[0004]为了实现上述目的,本专利技术实施例采用的技术方案如下:
[0005]第一方面,本专利技术实施例提供了一种列表排序方法,包括:获取待排序列表中的候选产品数据;将候选产品数据输入到预先训练好的购买率预测模型中,得到每个候选产品的购买率预估值;其中,购买率预测模型是基于去除偏差后的样本数据训练得到的;基于购买率预估值确定候选产品在待排序列表中的排序。
[0006]在一种实施方式中,基于购买率预估值确定候选产品在待排序列表中的排序,包括:将候选产品按照购买率预估值从大到小的顺序进行排序;基于排序结果,截取预设数量的候选产品在待排序列表进行展示。
[0007]在一种实施方式中,购买率预测模型的训练过程包括:获取第一样本数据和第二样本数据;其中,第一样本数据为曝光后产品数据,第二样本数据为包括第一样本数据的候选产品数据;基于第一样本数据和第二样本数据确定训练数据;其中,训练数据包括:产品的场景特征、产品属性、购买信息和数据类型;基于训练数据进行训练得到概率预测模型,并基于概率预测模型确定训练数据属于第一样本数据的概率;基于训练数据属于第一样本数据的概率对训练数据进行抽样,得到无偏的训练数据;基于无偏的训练数据训练得到购买率预测模型。
[0008]在一种实施方式中,基于训练数据属于第一样本数据的概率对第一样本数据进行抽样,得到无偏的训练数据,包括:基于训练数据属于第一样本数据的概率,采用预设加权算法确定抽样权重;基于抽样权重对第一样本数据进行抽样。
[0009]在一种实施方式中,基于抽样权重对所述第一样本数据进行抽样,得到无偏的训练数据之后,购买率预测模型的训练过程还包括:计算无偏的训练数据的标准化均数差,并基于标准化均数差判断无偏的训练数据是否存在偏差;如果无偏的训练数据存在偏差,则继续对第一样本数据进行抽样。
[0010]在一种实施方式中,基于标准化均数差判断无偏的训练数据是否存在偏差,包括:判断标准化均数差的绝对值是否超过预设值;如果是,则确定无偏的训练数据存在偏差。
[0011]第二方面,本专利技术实施例提供了一种列表排序装置,包括:数据获取模块,用于获取待排序列表中的候选产品数据;预测模块,用于将候选产品数据输入到预先训练好的购买率预测模型中,得到每个候选产品的购买率预估值;其中,购买率预测模型是基于去除偏差后的样本数据训练得到的;排序模块,用于基于购买率预估值确定候选产品在待排序列表中的排序。
[0012]在一种实施方式中,上述装置还包括模型训练模块,用于:获取第一样本数据和第二样本数据;其中,第一样本数据为曝光后产品数据,第二样本数据为包括第一样本数据的候选产品数据;基于第一样本数据和第二样本数据确定训练数据;其中,训练数据包括:产品的场景特征、产品属性、购买信息和数据类型;基于训练数据进行训练得到概率预测模型,并基于概率预测模型确定训练数据属于第一样本数据的概率;基于训练数据属于第一样本数据的概率对训练数据进行抽样,得到无偏的训练数据;基于无偏的训练数据训练得到购买率预测模型。
[0013]第三方面,本专利技术实施例提供了一种电子设备,包括处理器和存储器,存储器存储有能够被处理器执行的计算机可执行指令,处理器执行计算机可执行指令以实现上述第一方面提供的任一项的方法的步骤。
[0014]第四方面,本专利技术实施例提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器运行时执行上述第一方面提供的任一项的方法的步骤。
[0015]本专利技术实施例带来了以下有益效果:
[0016]本专利技术实施例提供列表排序方法、装置、电子设备及介质,首先,获取待排序列表中的候选产品数据;然后,将候选产品数据输入到预先训练好的购买率预测模型(基于去除偏差后的样本数据训练得到的)中,得到每个候选产品的购买率预估值;最后,基于购买率预估值确定候选产品在待排序列表中的排序。上述方法根据去除偏差后的样本数据训练得到购买率预测模型,降低了购买率预测模型参数估计的偏差,从而提高了输出的购买率预估值的准确性;其次,上述方法根据购买率预测模型输出的购买率预估值对候选产品进行排序,排序结果能够更加准确的反映用户的真实偏好,从而提高用户购买率。
[0017]本专利技术的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
[0018]为使本专利技术的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
[0019]为了更清楚地说明本专利技术具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0020]图1为本专利技术实施例提供的一种列表排序方法的流程图;
[0021]图2为本专利技术实施例提供的另一种列表排序方法的流程图;
[0022]图3为本专利技术实施例提供的一种列表排序装置的结构示意图;
[0023]图4为本专利技术实施例提供的一种电子设备的结构示意图。
具体实施方式
[0024]为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0025]目前,现有的个性化排序有本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种列表排序方法,其特征在于,包括:获取待排序列表中的候选产品数据;将所述候选产品数据输入到预先训练好的购买率预测模型中,得到每个候选产品的购买率预估值;其中,所述购买率预测模型是基于去除偏差后的样本数据训练得到的;基于所述购买率预估值确定所述候选产品在所述待排序列表中的排序。2.根据权利要求1所述的方法,其特征在于,基于所述购买率预估值确定所述候选产品在所述待排序列表中的排序,包括:将所述候选产品按照所述购买率预估值从大到小的顺序进行排序;基于排序结果,截取预设数量的候选产品在所述待排序列表进行展示。3.根据权利要求1所述的方法,其特征在于,所述购买率预测模型的训练过程包括:获取第一样本数据和第二样本数据;其中,所述第一样本数据为曝光后产品数据,所述第二样本数据为包括所述第一样本数据的候选产品数据;基于所述第一样本数据和所述第二样本数据确定训练数据;其中,所述训练数据包括:产品的场景特征、产品属性、购买信息和数据类型;基于所述训练数据进行训练得到概率预测模型,并基于所述概率预测模型确定所述训练数据属于所述第一样本数据的概率;基于所述训练数据属于所述第一样本数据的概率对所述训练数据进行抽样,得到无偏的训练数据;基于所述无偏的训练数据训练得到所述购买率预测模型。4.根据权利要求3所述的方法,其特征在于,基于所述训练数据属于所述第一样本数据的概率对所述训练数据进行抽样,得到无偏的训练数据,包括:基于所述训练数据属于所述第一样本数据的概率,采用预设加权算法确定抽样权重;基于所述抽样权重对所述第一样本数据进行抽样,得到无偏的训练数据。5.根据权利要求4所述的方法,其特征在于,基于所述抽样权重对所述第一样本数据进行抽样,得到无偏的训练数据之后,所述购买率预测模型的训练过程还包括:计算所述无偏的训练数据的标准化均数差,并基于所述标准化均数差...

【专利技术属性】
技术研发人员:王安琪
申请(专利权)人:艺龙网信息技术北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1