一种粗排序的方法及装置制造方法及图纸

技术编号：30101206 阅读：26 留言：0更新日期：2021-09-18 09:06

本申请公开了一种粗排序的方法及装置，该方法包括：获取用户的历史条目集合，并根据所述历史条目集合确定所述用户的多种兴趣点信息；获取候选条目集合，并确定所述候选条目集合中各候选条目分别与所述多种兴趣点信息的相关度分数；从所述相关度分数中确定各候选条目的最终相关度分数；根据各候选条目的最终相关度分数，从所述候选条目集合中选取用于进行精排序的目标候选条目。使得选出的目标候选条目与当前用户的历史使用习惯相匹配，用户个性化程度高，提高了粗排阶段筛选目标候选条目的质量和准确度。质量和准确度。质量和准确度。

全部详细技术资料下载

【技术实现步骤摘要】
一种粗排序的方法及装置

[0001]本申请实施例涉及数据处理
，尤其涉及一种粗排序的方法及装置。

技术介绍

[0002]在搜索、推荐、广告等需要进行大规模排序的场景中，漏斗式的级联排序架构得到了非常广泛的应用，级联排序架构按顺序一般包含召回、粗排、精排、重排序等模块，每个模块的候选条目数目依次减少。
[0003]粗排位于召回和精排之间，需要从上万个候选条目中挑出几百到一千个候选条目送入精排，设计时需要平衡耗时和准确度两方面的因素。一方面，由于耗时要求，粗排模型设计往往比精排简单，相较精排准确度较低；另一方面粗排使用的训练数据是最终由精排选出的曝光数据，而推理预测是面向比训练数据更广泛的数据，造成严重的选择偏见；并且曝光未点击的样本本身属于粗排模型返回的正样本，又将它们作为负样本，导致模型难以学习。这些因素造成了粗排模型预估的不准确性，影响推荐效果。

技术实现思路

[0004]本申请提供一种粗排序的方法及装置，以解决现有技术中在粗排阶段粗排模型预估准确性不高的问题。
[0005]第一方面，...

【技术保护点】

【技术特征摘要】
1.一种粗排序的方法，其特征在于，所述方法包括：获取用户的历史条目集合，并根据所述历史条目集合确定所述用户的多种兴趣点信息；获取候选条目集合，并确定所述候选条目集合中各候选条目分别与所述多种兴趣点信息的相关度分数；从所述相关度分数中确定各候选条目的最终相关度分数；根据各候选条目的最终相关度分数，从所述候选条目集合中选取用于进行精排序的目标候选条目。2.根据权利要求1所述的方法，其特征在于，所述根据所述历史条目集合确定所述用户的多种兴趣点信息，包括：生成各历史条目的历史条目向量；将各历史条目向量输入至预先训练的兴趣网络中，并获得所述兴趣网络输出的多种兴趣点信息。3.根据权利要求2所述的方法，其特征在于，所述兴趣网络包括第一全连接网络以及第二全连接网络，所述兴趣点信息包括初始兴趣点向量、最终兴趣点向量及兴趣点权重；所述将各历史条目向量输入至预先训练的兴趣网络中，并获得所述兴趣网络输出的多种兴趣点信息，包括：将各历史条目向量分别输入至预先训练的第一全连接网络以及第二全连接网络中，并获得所述第一全连接网络输出的各历史条目向量对应的一个或多个兴趣点的兴趣点权重，以及所述第二全连接网络输出的各历史条目向量对应的一个或多个兴趣点的初始兴趣点向量；根据各历史条目向量对应的一个或多个兴趣点的初始兴趣点向量以及对应的兴趣点权重，确定各兴趣点的最终兴趣点向量。4.根据权利要求3所述的方法，其特征在于，所述根据各历史条目向量对应的一个或多个兴趣点的初始兴趣点向量以及对应的兴趣点权重，确定各兴趣点的最终兴趣点向量，包括：针对每个历史条目向量，将该历史条目向量的各兴趣点权重进行归一化处理；计算各个兴趣点的初始兴趣点向量以及对应的归一化后的兴趣点权重的乘积，获得各个兴趣点的中间兴趣点向量；对所有历史条目中相同的兴趣点的中间兴趣点向量进行汇总，得到各兴趣点的最终兴趣点向量。5.根据权利要求1
‑

【专利技术属性】
技术研发人员：曹成龙，杨晚鹏，谭怒涛，
申请(专利权)人：百果园技术新加坡有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人