样本处理方法、设备、存储介质和程序产品技术

技术编号:44924772 阅读:20 留言:0更新日期:2025-04-08 19:04
本公开提供了一种样本处理方法、设备、存储介质和程序产品,属于互联网技术领域。采用该技术方案,对负样本进行进一步分级,分为多个标签排位,样本分级细腻,根据多个级别的训练样本,对排序模型进行训练。这样,会使排序模型的训练过程的收敛速度得到提升。

【技术实现步骤摘要】

本公开涉及互联网,特别涉及一种样本处理方法、设备、存储介质和程序产品


技术介绍

1、在搜索、推荐等需要进行大规模排序的场景,例如搜索歌曲,需要对搜索结果先粗排再精排,粗排过程的排序模型的训练样本包括正样本和负样本。

2、相关技术中,使用正样本和负样本配对对排序模型进行训练。

3、但是,使用上述样本处理方法,样本只分成正样本和负样本,样本分级粗糙,导致训练过程收敛速度较慢。


技术实现思路

1、为了解决相关技术问题,本公开提供了一种样本处理方法、设备和存储介质。技术方案如下:

2、第一方面,提供了一种样本处理方法,所述方法包括:

3、获取目标搜索过程中作为搜索结果的多个媒体数据的搜索排位和点击情况;

4、基于所述搜索排位和点击情况,从所述多个媒体数据中选取参考媒体数据;

5、基于各所述媒体数据的用户满意度和搜索排位、以及所述参考媒体数据,在所述多个媒体数据中,确定负样本媒体数据和各所述负样本媒体数据的标签排位;

<p>6、基于所述负样本文档来自技高网...

【技术保护点】

1.一种样本处理方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征的在于,所述基于所述搜索排位和点击情况,从所述多个媒体数据中选取参考媒体数据,包括:

3.根据权利要求1或2所述的方法,其特征的在于,所述基于各所述媒体数据的用户满意度和搜索排位、以及所述参考媒体数据,在所述多个媒体数据中,确定负样本媒体数据和各所述负样本媒体数据的标签排位之前,所述方法还包括:

4.根据权利要求1所述的方法,其特征在于,所述基于各所述媒体数据的用户满意度和搜索排位、以及所述参考媒体数据,在所述多个媒体数据中,确定负样本媒体数据和各所述负样本媒体数据的...

【技术特征摘要】

1.一种样本处理方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征的在于,所述基于所述搜索排位和点击情况,从所述多个媒体数据中选取参考媒体数据,包括:

3.根据权利要求1或2所述的方法,其特征的在于,所述基于各所述媒体数据的用户满意度和搜索排位、以及所述参考媒体数据,在所述多个媒体数据中,确定负样本媒体数据和各所述负样本媒体数据的标签排位之前,所述方法还包括:

4.根据权利要求1所述的方法,其特征在于,所述基于各所述媒体数据的用户满意度和搜索排位、以及所述参考媒体数据,在所述多个媒体数据中,确定负样本媒体数据和各所述负样本媒体数据的标签排位,包括:

5.根据权利要求4所述的方法,其特征在于,所述基于各所述媒体数据的用户满意度和搜索排位、以及所述参考媒体数据,在所述多个媒体数据中,确定第一负样本媒体数据,包括:

6.根据权利要求5所述的方法,其特征在于,所述确定第二负样本媒体数据,包括:

7.根据权利要求6所述的方法,其特征在于,所述确定第三负样本媒体数据,包括:

8.根据权利要求5所述的方法,其特征在于,所述在所述多个媒体数据中,确定用户满意度和搜索排位满足指定条件的第一媒体数据,包括:

9.根据权利要求4所述的方法...

【专利技术属性】
技术研发人员:文浩宇潘树燊
申请(专利权)人:腾讯音乐娱乐科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1