一种数据排序方法、装置、设备及介质制造方法及图纸

技术编号:32228145 阅读:33 留言:0更新日期:2022-02-09 17:32
本公开实施例涉及一种数据排序方法、装置、设备及介质,其中该方法包括:获取待处理文本,并确定待处理文本对应的多个候选领域类别;针对每个候选领域类别,获取该候选领域类别对应的召回策略,并基于召回策略进行搜索,以得到待处理文本在该候选领域类别对应的召回数据;其中,不同候选领域类别对应的召回策略不同;基于多个候选领域类别对应的召回数据进行混合排序,得到排序结果。本公开实施例提供的上述排序方式可以更好地满足用户的搜索需求。需求。需求。

【技术实现步骤摘要】
一种数据排序方法、装置、设备及介质


[0001]本公开涉及数据处理
,尤其涉及一种数据排序方法、装置、设备及介质。

技术介绍

[0002]搜索引擎是协助用户搜索所需内容的计算机程序,其能够针对用户输入的搜索文本(query)进行搜索,得到与query相关的多条召回数据,并按照一定策略对召回数据进行排序,将排序后的数据作为搜索结果呈现给用户。然而,现有的排序方式效果不佳,大多难以满足用户的搜索需求,用户的搜索体验较差。

技术实现思路

[0003]为了解决上述技术问题或者至少部分地解决上述技术问题,本公开提供了一种数据排序方法、装置、设备及介质。
[0004]本公开实施例提供了一种数据排序方法,所述方法包括:获取待处理文本,并确定所述待处理文本对应的多个候选领域类别;针对每个所述候选领域类别,获取该候选领域类别对应的召回策略,并基于所述召回策略进行搜索,以得到所述待处理文本在该候选领域类别对应的召回数据;其中,不同候选领域类别对应的召回策略不同;基于多个所述候选领域类别对应的召回数据进行混合排序,得到排序结果。
...

【技术保护点】

【技术特征摘要】
1.一种数据排序方法,其特征在于,包括:获取待处理文本,并确定所述待处理文本对应的多个候选领域类别;针对每个所述候选领域类别,获取该候选领域类别对应的召回策略,并基于所述召回策略进行搜索,以得到所述待处理文本在该候选领域类别对应的召回数据;其中,不同候选领域类别对应的召回策略不同;基于多个所述候选领域类别对应的召回数据进行混合排序,得到排序结果。2.根据权利要求1所述的方法,其特征在于,确定所述待处理文本对应的多个候选领域类别的步骤,包括:采用意图识别算法对所述待处理文本进行处理,以确定所述待处理文本对应的多个候选领域类别。3.根据权利要求1所述的方法,其特征在于,基于多个所述领域类别对应的召回数据进行混合排序,得到排序结果的步骤,包括:对多个所述候选领域类别进行排序;将排在前N位的候选领域类别均作为目标领域类别,其中,N为预设整数;基于所述目标领域类别对应的召回数据进行混合排序,得到排序结果。4.根据权利要求3所述的方法,其特征在于,对多个所述候选领域类别进行排序的步骤,包括:获取领域排序参考因素;所述领域排序参考因素包括以下中的一种或多种:所述待处理文本的文本标签、所述待处理文本对应的用户标签、网络热点信息、各个所述候选领域类别对应的权重、各个所述候选领域类别对应的召回数据量;根据所述领域排序参考因素,对多个所述候选领域类别进行排序。5.根据权利要求3所述的方法,其特征在于,基于所述目标领域类别对应的召回数据进行混合排序,得到排序结果的步骤,包括:确定各个所述目标领域类别对应的待混合的目标召回数据;其中,排序在前的目标领域类别对应的目标召回数据的数据量大于排序在后的目标领域类别对应的目标召回数据的数据量;将各个所...

【专利技术属性】
技术研发人员:刘大伟王德鑫郑伟
申请(专利权)人:北京库睿科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1