【技术实现步骤摘要】
一种搜索结果的排序方法和相关装置
[0001]本申请涉及人工智能
,特别是涉及一种搜索结果的排序方法和相关装置。
技术介绍
[0002]在搜索系统中,通常包括问题理解、召回和排序三个步骤。其中,问题理解是对搜索文本的分析,召回是基于搜索文本得到可以作为搜索结果的多个候选文本,排序是对多个候选文本进行排序后返回给用户,以更好地展示搜索结果,方便用户点击。
[0003]相关技术中,针对于排序步骤通常采用搜索文本和候选文本间的文本相似度进行排序,即候选文本和搜索文本的文本相似度越高,该候选文本在多个候选文本中的排序越靠前。
[0004]但是,使用搜索文本和候选文本间的文本相似度进行排序的方法存在排序质量较低的问题。
技术实现思路
[0005]为了解决上述技术问题,本申请提供了一种搜索排序方法和相关装置,用于提高候选文本的排序质量。
[0006]本申请实施例公开了如下技术方案:
[0007]一方面,本申请实施例提供一种搜索结果的排序方法,所述方法包括:
[0008]获取搜索文本和多个候选文本,所述多个候选文本为根据所述搜索文本召回得到的多个文本;
[0009]通过比较所述多个候选文本之间的语义相关性,得到各个所述候选文本作为所述搜索文本的搜索结果的准确性;
[0010]根据各个所述候选文本作为所述搜索结果的准确性,确定所述多个候选文本作为所述搜索结果的排列顺序。
[0011]另一方面,本申请实施例提供一种搜索结果的排序装置,所述装置包括:获 ...
【技术保护点】
【技术特征摘要】
1.一种搜索结果的排序方法,其特征在于,所述方法包括:获取搜索文本和多个候选文本,所述多个候选文本为根据所述搜索文本召回得到的多个文本;通过比较所述多个候选文本之间的语义相关性,得到各个所述候选文本作为所述搜索文本的搜索结果的准确性;根据各个所述候选文本作为所述搜索结果的准确性,确定所述多个候选文本作为所述搜索结果的排列顺序。2.根据权利要求1所述的方法,其特征在于,所述通过比较所述多个候选文本之间的语义相关性,得到各个所述候选文本作为所述搜索文本的搜索结果的准确性,包括:将所述搜索文本分别和各个所述候选文本进行拼接,得到多个拼接文本;通过比较所述多个拼接文本中任意两个拼接文本间的语义相关性,得到各个所述拼接文本包括的候选文本作为所述搜索结果的准确性。3.根据权利要求2所述的方法,其特征在于,所述通过比较所述多个拼接文本中任意两个拼接文本间的语义相关性,得到各个所述拼接文本包括的候选文本作为所述搜索结果的准确性,包括:根据第一拼接文本,通过编码模型获得第一文本向量,所述第一拼接文本包括第一候选文本;根据第二拼接文本,通过所述编码模型获得第二文本向量,所述第二拼接文本包括第二候选文本;根据所述第一文本向量和所述第二文本向量,通过语义比较模型确定所述第一候选文本和所述第二候选文本间的偏好参数,所述第一候选文本和所述第二候选文本间的偏好参数用于标识第一相关性高于第二相关性的程度,所述第一相关性为所述第一候选文本和所述搜索文本间的语义相关性,所述第二相关性为所述第二候选文本和所述搜索文本间的语义相关性;将所述多个拼接文本中任意两个拼接文本分别作为所述第一拼接文本和所述第二拼接文本,获取所述多个候选文本中任意两个候选文本间的偏好参数;根据所述任意两个候选文本间的偏好参数,确定各个所述候选文本作为所述搜索结果的准确性。4.根据权利要求3所述的方法,其特征在于,所述方法还包括:获取样本搜索文本和多个样本候选文本,所述多个样本候选文本包括一个最优样本候选文本和多个次优样本候选文本;根据第一样本拼接文本,通过初始编码模型获得第一样本文本向量,所述第一样本拼接文本包括第一样本候选文本;根据第二样本拼接文本,通过所述初始编码模型获得第二样本文本向量,所述第二样本拼接文本包括第二样本候选文本;根据所述第一样本文本向量和所述第二样本文本向量,通过初始语义比较模型确定所述第一样本候选文本和所述第二样本候选文本间的偏好参数,所述第一样本候选文本和所述第二样本候选文本间的偏好参数用于标识第一样本相关性高于第二样本相关性的程度,所述第一样本相关性为所述第一样本候选文本和所述样本搜索文本间的语义相关性,所述
第二样本相关性为所述第二样本候选文本和所述样本搜索文本间的语义相关性;将所述多个样本拼接文本中任意两个样本拼接文本分别作为所述第一样本拼接文本和所述第二样本拼接文本,获取所述多个样本候选文本中任意两个样本候选文本间的偏好参数;根据任意两个样本候选文本间的偏好参数,确定各个样本候选文本作为搜索结果的准确性;调整所述初始编码模型的参数和所述初始语义比较模型的参数,直至所述最优样本候选文本作为搜索结果的准确性最大,得到所述编码模型和所述语义比较模型。5.根据权利要求3所述的方法,其特征在于,所述根据所述任意两个候选文本间的偏好参数,确定各个所述候选文本作为所述搜索结果的准确性,包括:获取目标候选文本和其他候选文本间的多个偏好参数,所述目标候选文本为所述多个候选文本中的一个候选文本,所述其他候选文本为所述多个候选文本中除所述目标候选文本外的多个候选文本;根据所述目标候选文本和所述其他候选文本间的多个偏好参数,确定所述目标候选文本作为所述搜索结果的准确性;将所述多个候选文本分别作为所述目标候选文本,确定各个所述候选文本作为所述搜索结果的准确性。6.根据权利要...
【专利技术属性】
技术研发人员:罗锦文,郭伟东,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。