排序模型训练方法及装置、电子设备及可读存储介质制造方法及图纸

技术编号:34321161 阅读:28 留言:0更新日期:2022-07-31 00:13
本发明专利技术公开了一种排序模型训练方法及装置、电子设备及可读存储介质。其中,该方法包括:根据预设训练样本确定排序损失函数,排序损失函数用于表示预设训练样本的排序的正样本以及负样本的概率;根据预设训练样本以及排序损失函数对预设排序模型进行训练。本发明专利技术解决了由于相关技术存在排序分数比较集中,而导致粗排序对样本的区分度不够的技术问题。致粗排序对样本的区分度不够的技术问题。致粗排序对样本的区分度不够的技术问题。

Sorting model training method and device, electronic equipment and readable storage medium

【技术实现步骤摘要】
排序模型训练方法及装置、电子设备及可读存储介质


[0001]本专利技术涉及数据库
,具体而言,涉及一种排序模型训练方法及装置、电子设备及可读存储介质。

技术介绍

[0002]工业级的搜索引擎架构往往采用匹配、粗排、精排、重排的架构。粗排层处在匹配和精排之间,该层的主要目标是在一定延时约束下从上万的候选召回集合中选择出最好的百级别的文档进入精排层。
[0003]粗排层模型设计相比精排层有两个特点:
[0004]1)排序量大:因为其候选排序集合数量较大,不仅对排序效率要求比较高,而且要求排序模型对长尾数据具有更好的区分性;
[0005]2)数据分布差异大:粗排的排序与最终的结果展示环节较远,粗排数据选择存在较大Bias,因此对排序样本选择要求较高。
[0006]传统粗排层的排序目标大多采用Pointwise或者Pairwise的排序损失函数。
[0007]申请人在实现本专利技术的过程中,发现相关技术中至少存在以下技术问题。
[0008]现有排序目标存在一定程度的模型坍塌问题。所谓模型坍塌就是指排本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种排序模型训练方法,其特征在于,包括:根据预设训练样本确定排序损失函数,所述排序损失函数用于表示所述预设训练样本的排序的正样本以及负样本的概率;根据所述预设训练样本以及所述排序损失函数对预设排序模型进行训练。2.根据权利要求1所述的方法,其特征在于,根据预设训练样本确定排序损失函数,包括:根据所述预设训练样本中的正样本与多个负样本的概率确定所述排序损失函数。3.根据权利要求2所述的方法,其特征在于,根据所述预设训练样本中的正样本与多个负样本的概率确定所述排序损失函数,包括:确定所述正样本的概率对应的正样本导数以及所述多个负样本的概率对应的负样本导数;根据所述正样本导数、所述负样本导数以及预设惩罚系数确定所述排序损失函数。4.根据权利要求3所述的方法,其特征在于,所述正样本导数为:所述负样本导数为:所述预设惩罚系数为:其中,s0为所述预设训练样本中的正样本,s
j
为所述预设训练样本中的负样本。5.根据权利要求1所述的方法,其特征在于,所述排序损失函数为:其中,s0为所述预设训练样本中的正样本,s
j
为所述预设训练样本中的...

【专利技术属性】
技术研发人员:曹越黄培浩肖垚陈达遥陈胜
申请(专利权)人:北京三快在线科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1