一种搜索结果的排序方法和相关装置制造方法及图纸

技术编号:39312747 阅读:7 留言:0更新日期:2023-11-12 15:57
本申请实施例公开了一种搜索结果的排序方法和相关装置,至少涉及人工智能中的机器学习,获取搜索文本和基于该搜索文本召回得到的多个候选文本,通过比较多个候选文本之间的语义相关性,能够增强多个候选文本之间的交互,从而度量多个候选文本之间的语义差别,进而得到各个候选文本作为搜索文本的搜索结果的准确性,即从多个候选文本中确定更适合作为该搜索文本的搜索结果的候选文本。根据各个候选文本作为搜索结果的准确性,确定多个候选文本作为搜索结果的排列顺序。由此,通过比较多个候选文本之间的语义相关性,能够明确多个候选文本之间的语义相关性对搜索结果排序的影响,从而提高多个候选文本之间排列顺序的准确性。而提高多个候选文本之间排列顺序的准确性。而提高多个候选文本之间排列顺序的准确性。

【技术实现步骤摘要】
一种搜索结果的排序方法和相关装置


[0001]本申请涉及人工智能
,特别是涉及一种搜索结果的排序方法和相关装置。

技术介绍

[0002]在搜索系统中,通常包括问题理解、召回和排序三个步骤。其中,问题理解是对搜索文本的分析,召回是基于搜索文本得到可以作为搜索结果的多个候选文本,排序是对多个候选文本进行排序后返回给用户,以更好地展示搜索结果,方便用户点击。
[0003]相关技术中,针对于排序步骤通常采用搜索文本和候选文本间的文本相似度进行排序,即候选文本和搜索文本的文本相似度越高,该候选文本在多个候选文本中的排序越靠前。
[0004]但是,使用搜索文本和候选文本间的文本相似度进行排序的方法存在排序质量较低的问题。

技术实现思路

[0005]为了解决上述技术问题,本申请提供了一种搜索排序方法和相关装置,用于提高候选文本的排序质量。
[0006]本申请实施例公开了如下技术方案:
[0007]一方面,本申请实施例提供一种搜索结果的排序方法,所述方法包括:
[0008]获取搜索文本和多个候选文本,所述多个候选文本为根据所述搜索文本召回得到的多个文本;
[0009]通过比较所述多个候选文本之间的语义相关性,得到各个所述候选文本作为所述搜索文本的搜索结果的准确性;
[0010]根据各个所述候选文本作为所述搜索结果的准确性,确定所述多个候选文本作为所述搜索结果的排列顺序。
[0011]另一方面,本申请实施例提供一种搜索结果的排序装置,所述装置包括:获取单元、比较单元和确定单元;
[0012]所述获取单元,用于获取搜索文本和多个候选文本,所述多个候选文本为根据所述搜索文本召回得到的多个文本;
[0013]所述比较单元,用于通过比较所述多个候选文本之间的语义相关性,得到各个所述候选文本作为所述搜索文本的搜索结果的准确性;
[0014]所述确定单元,用于根据各个所述候选文本作为所述搜索结果的准确性,确定所述多个候选文本作为所述搜索结果的排列顺序。
[0015]另一方面,本申请实施例提供一种计算机设备,所述计算机设备包括处理器以及存储器:
[0016]所述存储器用于存储计算机程序,并将所述计算机程序传输给所述处理器;
[0017]所述处理器用于根据所述计算机程序中的指令执行上述方面所述的方法。
[0018]另一方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机程序,所述计算机程序用于执行上述方面所述的方法。
[0019]另一方面,本申请实施例提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述方面所述的方法。
[0020]由上述技术方案可以看出,获取搜索文本和基于该搜索文本召回得到的多个候选文本,通过比较多个候选文本之间的语义相关性,能够增强多个候选文本之间的交互,从而度量多个候选文本之间的语义差别,进而得到各个候选文本作为搜索文本的搜索结果的准确性,即从多个候选文本中确定更适合作为该搜索文本的搜索结果的候选文本。根据各个候选文本作为搜索结果的准确性,确定多个候选文本作为搜索结果的排列顺序。由此,通过比较多个候选文本之间的语义相关性,能够明确多个候选文本之间的语义相关性对搜索结果排序的影响,从而提高多个候选文本之间排列顺序的准确性。
附图说明
[0021]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0022]图1为一种搜索结果的排序方法的示意图;
[0023]图2为本申请实施例提供的搜索结果的排序方法的应用场景示意图;
[0024]图3为本申请实施例提供的搜索结果的排序方法的流程示意图;
[0025]图4为本申请实施例提供的一种难以度量候选文本之间的语义差别的示意图;
[0026]图5为本申请实施例提供的一种比较多个候选文本之间语义相关性的示意图;
[0027]图6为本申请实施例提供的一种比较多个候选文本之间语义相关性的示意图;
[0028]图7为本申请实施例提供的一种比较任意两个拼接文本间的语义相关性的示意图;
[0029]图8为本申请实施例提供的一种确定偏好参数的示意图;
[0030]图9为本申请实施例提供的一种偏好参数的示意图;
[0031]图10为本申请实施例提供的一种图8所示的偏好矩阵的示意图;
[0032]图11为本申请实施例提供的训练模型的示意图;
[0033]图12为本申请实施例提供的一种搜索结果的排序方法的示意图;
[0034]图13为本申请实施例提供的一种搜索结果的排序方法的应用场景示意图;
[0035]图14为本申请实施例提供的一种搜索结果的排序装置的结构示意图;
[0036]图15为本申请实施例提供的服务器的结构示意图;
[0037]图16为本申请实施例提供的终端设备的结构示意图。
具体实施方式
[0038]下面结合附图,对本申请的实施例进行描述。
[0039]参见图1,该图为一种搜索结果的排序方法的示意图。根据问题q1,通过检索方式快速获得3个候选文本D1、D2和D3。虽然检索效率很高,但是可能会返回不相关的候选文本,而且候选文本的排序准确性较低。为了获得更好的推荐效果,可以将搜索文本和候选文本同时传入一个网络,以获取搜索文本和候选文本之间的文本相似度的分数,然后通过这个分数进行重排序。具体地,将问题q1分别和3个候选文本分别进行拼接,得到拼接文本q1D1、q2D2和q3D3,再将3个拼接文本分别输入至基于变化器的双向编码器表示(Bidirectional Encoder Representation from Transformers,BERT)模型和多层感知器(Multilayer Perceptron,MLP)中,分别得到各个候选文本与问题q1之间的文本相似度的分数S1=0.9、S2=0.5和S3=0.4,由此,三个候选文本的排列顺序依次为D1、D2和D3,从而将排列顺序和候选文本返回给用户,以更好地展示搜索结果,方便用户点击。
[0040]经过分析发现,使用文本相似度进行排序的方法存在排序质量较低的问题,是因为仅依赖搜索文本和候选文本之间的文本相似度进行排序,难以有效度量候选文本之间的语义差别,导致不能将较为准确的候选文本排序到前列。基于此,本申请实施例提供一种搜索结果的排序方法,通过比较多个候选文本之间的语义相关性,能够增强多个候选文本之间的交互,从而度量多个候选文本之间的语义差别,进而得到各个本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种搜索结果的排序方法,其特征在于,所述方法包括:获取搜索文本和多个候选文本,所述多个候选文本为根据所述搜索文本召回得到的多个文本;通过比较所述多个候选文本之间的语义相关性,得到各个所述候选文本作为所述搜索文本的搜索结果的准确性;根据各个所述候选文本作为所述搜索结果的准确性,确定所述多个候选文本作为所述搜索结果的排列顺序。2.根据权利要求1所述的方法,其特征在于,所述通过比较所述多个候选文本之间的语义相关性,得到各个所述候选文本作为所述搜索文本的搜索结果的准确性,包括:将所述搜索文本分别和各个所述候选文本进行拼接,得到多个拼接文本;通过比较所述多个拼接文本中任意两个拼接文本间的语义相关性,得到各个所述拼接文本包括的候选文本作为所述搜索结果的准确性。3.根据权利要求2所述的方法,其特征在于,所述通过比较所述多个拼接文本中任意两个拼接文本间的语义相关性,得到各个所述拼接文本包括的候选文本作为所述搜索结果的准确性,包括:根据第一拼接文本,通过编码模型获得第一文本向量,所述第一拼接文本包括第一候选文本;根据第二拼接文本,通过所述编码模型获得第二文本向量,所述第二拼接文本包括第二候选文本;根据所述第一文本向量和所述第二文本向量,通过语义比较模型确定所述第一候选文本和所述第二候选文本间的偏好参数,所述第一候选文本和所述第二候选文本间的偏好参数用于标识第一相关性高于第二相关性的程度,所述第一相关性为所述第一候选文本和所述搜索文本间的语义相关性,所述第二相关性为所述第二候选文本和所述搜索文本间的语义相关性;将所述多个拼接文本中任意两个拼接文本分别作为所述第一拼接文本和所述第二拼接文本,获取所述多个候选文本中任意两个候选文本间的偏好参数;根据所述任意两个候选文本间的偏好参数,确定各个所述候选文本作为所述搜索结果的准确性。4.根据权利要求3所述的方法,其特征在于,所述方法还包括:获取样本搜索文本和多个样本候选文本,所述多个样本候选文本包括一个最优样本候选文本和多个次优样本候选文本;根据第一样本拼接文本,通过初始编码模型获得第一样本文本向量,所述第一样本拼接文本包括第一样本候选文本;根据第二样本拼接文本,通过所述初始编码模型获得第二样本文本向量,所述第二样本拼接文本包括第二样本候选文本;根据所述第一样本文本向量和所述第二样本文本向量,通过初始语义比较模型确定所述第一样本候选文本和所述第二样本候选文本间的偏好参数,所述第一样本候选文本和所述第二样本候选文本间的偏好参数用于标识第一样本相关性高于第二样本相关性的程度,所述第一样本相关性为所述第一样本候选文本和所述样本搜索文本间的语义相关性,所述
第二样本相关性为所述第二样本候选文本和所述样本搜索文本间的语义相关性;将所述多个样本拼接文本中任意两个样本拼接文本分别作为所述第一样本拼接文本和所述第二样本拼接文本,获取所述多个样本候选文本中任意两个样本候选文本间的偏好参数;根据任意两个样本候选文本间的偏好参数,确定各个样本候选文本作为搜索结果的准确性;调整所述初始编码模型的参数和所述初始语义比较模型的参数,直至所述最优样本候选文本作为搜索结果的准确性最大,得到所述编码模型和所述语义比较模型。5.根据权利要求3所述的方法,其特征在于,所述根据所述任意两个候选文本间的偏好参数,确定各个所述候选文本作为所述搜索结果的准确性,包括:获取目标候选文本和其他候选文本间的多个偏好参数,所述目标候选文本为所述多个候选文本中的一个候选文本,所述其他候选文本为所述多个候选文本中除所述目标候选文本外的多个候选文本;根据所述目标候选文本和所述其他候选文本间的多个偏好参数,确定所述目标候选文本作为所述搜索结果的准确性;将所述多个候选文本分别作为所述目标候选文本,确定各个所述候选文本作为所述搜索结果的准确性。6.根据权利要...

【专利技术属性】
技术研发人员:罗锦文郭伟东
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1