【技术实现步骤摘要】
本申请实施例涉及数据搜索,尤其涉及一种排序模型的训练的方法、搜索方法、装置及其设备。
技术介绍
1、随着计算机技术的快速发展,视频已经成为人们日常生活中获取信息和享受娱乐的主要载体。用户通过搜索框输入搜索词,检索模型根据搜索词获取与搜索词相关的搜索文档,排序模型对搜索文档排序后展示给用户,用户可以对搜索文档进行消费,例如,点击、播放、收藏、转发等。
2、在视频搜索场景下,对用户的历史消费(点击、播放等)行为进行建模可以有效提高搜索需求识别的准确度。现有的排序模型的通常采用实时训练方法,对排序模型的参数实时更新,以使得排序模型能够适应不断变化的数据,提高排序模型的准确性。然而,现有的训练数据的获取方式导致训练数据的滞后性,例如,用户在进行一次搜索之后,服务端需要从不同的数据源分别获取搜索词相关数据、搜索结果的展示信息以及用户消费行为等原始数据,对获取的原始数据进行清洗、拼接等数据处理,才能形成训练数据。
3、一些搜查场景中,例如,用户在短期内多次重复搜索或者换搜索词搜索,用户短期实时的搜索消费行为对模型预估有很大价
...【技术保护点】
1.一种排序模型的训练方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,获取当前时间之前的第一时间内的最新搜索会话数据和即时搜索行为序列,包括:
3.根据权利要求2所述的方法,其特征在于,根据所述原始搜索数据中的搜索文档的交互行为生成所述搜索文档的交互标签之前,还包括:
4.根据权利要求1-3任一项所述的方法,其特征在于,所述训练数据中还包括历史推荐行为序列;
5.根据权利要求4所述的方法,其特征在于,所述对所述用户的所述历史搜索特征、所述即时搜索特征和所述历史推荐特征进行特征组合,得到组合搜索特征,包
6...
【技术特征摘要】
1.一种排序模型的训练方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,获取当前时间之前的第一时间内的最新搜索会话数据和即时搜索行为序列,包括:
3.根据权利要求2所述的方法,其特征在于,根据所述原始搜索数据中的搜索文档的交互行为生成所述搜索文档的交互标签之前,还包括:
4.根据权利要求1-3任一项所述的方法,其特征在于,所述训练数据中还包括历史推荐行为序列;
5.根据权利要求4所述的方法,其特征在于,所述对所述用户的所述历史搜索特征、所述即时搜索特征和所述历史推荐特征进行特征组合,得到组合搜索特征,包括:
6.根据权利要求4所述的方法,其特征在于,所述对所述用户的所述历史搜索特征、所述即时搜索特征和所述历史推荐特征进行特征组合,得到组合搜索特征,包括:
7.根据权利要求1-3任一项所述的方法,其特征在于,所述历史搜索行为序列包括所述用户在第二时间内的多个第一搜索行为序列,所述第一搜索行为序列包括搜索词相关数据、与所述搜索词相关数据对应的至少...
【专利技术属性】
技术研发人员:冯太锐,秦成鹏,张颖,王郡浩,
申请(专利权)人:北京字跳网络技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。