排序模型的训练的方法、搜索方法、装置及其设备制造方法及图纸

技术编号:40646664 阅读:31 留言:0更新日期:2024-03-13 21:26
本申请实施例提供一种排序模型的训练的方法、搜索方法、装置及其设备,训练设备通过获取多个用户的训练数据,训练数据包括用户授权的历史搜索行为序列、当前时间之前的第一时间内的用户授权的最新搜索会话数据和即时搜索行为序列,根据历史搜索行为序列确定用户的历史搜索特征,根据即时搜索行为序列确定用户的即时搜索特征,根据最新搜索会话数据确定用户的最新搜索特征,对用户的历史搜索特征和即时搜索特征进行特征组合,得到组合搜索特征,使用该组合搜索特征和最新搜索特征对排序模型进行训练。由于获取的即时搜索行为序列的时延很小,基于该即时搜索行为序列对排序模型进行训练和预测,能够提高排序模型的排序结果的准确性。

【技术实现步骤摘要】

本申请实施例涉及数据搜索,尤其涉及一种排序模型的训练的方法、搜索方法、装置及其设备


技术介绍

1、随着计算机技术的快速发展,视频已经成为人们日常生活中获取信息和享受娱乐的主要载体。用户通过搜索框输入搜索词,检索模型根据搜索词获取与搜索词相关的搜索文档,排序模型对搜索文档排序后展示给用户,用户可以对搜索文档进行消费,例如,点击、播放、收藏、转发等。

2、在视频搜索场景下,对用户的历史消费(点击、播放等)行为进行建模可以有效提高搜索需求识别的准确度。现有的排序模型的通常采用实时训练方法,对排序模型的参数实时更新,以使得排序模型能够适应不断变化的数据,提高排序模型的准确性。然而,现有的训练数据的获取方式导致训练数据的滞后性,例如,用户在进行一次搜索之后,服务端需要从不同的数据源分别获取搜索词相关数据、搜索结果的展示信息以及用户消费行为等原始数据,对获取的原始数据进行清洗、拼接等数据处理,才能形成训练数据。

3、一些搜查场景中,例如,用户在短期内多次重复搜索或者换搜索词搜索,用户短期实时的搜索消费行为对模型预估有很大价值。但是,上述获取训本文档来自技高网...

【技术保护点】

1.一种排序模型的训练方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,获取当前时间之前的第一时间内的最新搜索会话数据和即时搜索行为序列,包括:

3.根据权利要求2所述的方法,其特征在于,根据所述原始搜索数据中的搜索文档的交互行为生成所述搜索文档的交互标签之前,还包括:

4.根据权利要求1-3任一项所述的方法,其特征在于,所述训练数据中还包括历史推荐行为序列;

5.根据权利要求4所述的方法,其特征在于,所述对所述用户的所述历史搜索特征、所述即时搜索特征和所述历史推荐特征进行特征组合,得到组合搜索特征,包括:

6...

【技术特征摘要】

1.一种排序模型的训练方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,获取当前时间之前的第一时间内的最新搜索会话数据和即时搜索行为序列,包括:

3.根据权利要求2所述的方法,其特征在于,根据所述原始搜索数据中的搜索文档的交互行为生成所述搜索文档的交互标签之前,还包括:

4.根据权利要求1-3任一项所述的方法,其特征在于,所述训练数据中还包括历史推荐行为序列;

5.根据权利要求4所述的方法,其特征在于,所述对所述用户的所述历史搜索特征、所述即时搜索特征和所述历史推荐特征进行特征组合,得到组合搜索特征,包括:

6.根据权利要求4所述的方法,其特征在于,所述对所述用户的所述历史搜索特征、所述即时搜索特征和所述历史推荐特征进行特征组合,得到组合搜索特征,包括:

7.根据权利要求1-3任一项所述的方法,其特征在于,所述历史搜索行为序列包括所述用户在第二时间内的多个第一搜索行为序列,所述第一搜索行为序列包括搜索词相关数据、与所述搜索词相关数据对应的至少...

【专利技术属性】
技术研发人员:冯太锐秦成鹏张颖王郡浩
申请(专利权)人:北京字跳网络技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1