搜索结果排序方法和装置制造方法及图纸

技术编号:19822077 阅读:29 留言:0更新日期:2018-12-19 14:48
本发明专利技术实施例提出一种搜索结果排序方法和装置。该方法包括:从第一排序结果中获取用户请求和候选结果,用户请求中包括搜索问题,候选结果中包括候选问题和每个候选问题对应的候选答案;获取搜索问题与候选问题的第一相关性指标;获取搜索问题与候选答案的第二相关性指标;根据第一相关性指标和第二相关性指标,对第一排序结果进行重排序,得到第二排序结果。因为在第二排序中加入了更多特定的相关性指标,从而使排序结果不受单一排序方法的限定,可以更好更方便地提供精准的回答排序以及处理一些特定的问题。

【技术实现步骤摘要】
搜索结果排序方法和装置
本专利技术涉及自动问答
,尤其涉及一种搜索结果排序方法和装置。
技术介绍
随着互联网的快速发展,出现了大量的与医疗知识方面相关的搜索需求。针对这些搜索需求,衍生出了医疗智能问答服务。在医疗自动问答中,因为涉及到医疗的特殊性和回答的严谨性,现有主要的方法是对已有回答内容进行相关性排序给出答案。然而这些依靠单一相关性排序的方法由于片面性、局限性等,缺乏对问答相关性的全面的衡量,难以给出精准的排序结果。并且其他领域的问答方法也无法直接扩展到医疗领域。方案(1)基于问题和问题的信息进行排序,忽略了答案中包含的关键信息,想要得到好的排序结果非常依赖于原始问答库中问答的优质性。方案(2)基于问题和答案的信息进行排序,忽略了问题中包含的关键信息,在医疗领域,问题偏差一点,答案可能完全不同,因此会导致排序不准。方案(3)基于问题、答案合并的方法进行排序,虽然包含了问题和答案的信息,但是一种排序方法对排序结果是有侧重的,无法在医疗智能问答中应对比较复杂的场景。
技术实现思路
本专利技术实施例提供一种搜索结果排序方法和装置,以解决现有技术中的一个或多个技术问题。第一方面,本专利技术实施例提供了一种搜索结果排序方法,包括:从第一排序结果中获取用户请求和候选结果,所述用户请求中包括搜索问题,所述候选结果中包括候选问题和每个候选问题对应的候选答案;获取所述搜索问题与所述候选问题的第一相关性指标;获取所述搜索问题与所述候选答案的第二相关性指标;根据所述第一相关性指标和所述第二相关性指标,对所述第一排序结果进行重排序,得到第二排序结果。结合第一方面,本专利技术实施例在第一方面的第一种实现方式中,根据所述第一相关性指标和所述第二相关性指标,对所述第一排序结果进行重排序,得到第二排序结果,包括:根据所述第一相关性指标确定高优先级列表中包括的候选问答组;根据所述第二相关性指标确定低优先级列表中包括的候选问答组;将所述高优先级列表和所述低优先级列表中的候选问答组,按照高优先级在前、低优先级在后的顺序进行合并,得到所述第二排序结果。结合第一方面的第一种实现方式,本专利技术实施例在第一方面的第二种实现方式中,根据所述第一相关性指标确定高优先级列表中包括的候选问答组,包括:如果一个候选问答组的至少一个第一相关性指标高于设定阈值,则将所述候选问答组加入高优先级列表。结合第一方面的第一种实现方式,本专利技术实施例在第一方面的第三种实现方式中,根据所述第二相关性指标确定低优先级列表中包括的候选问答组,包括:如果一个候选问答组的至少一个第二相关性指标高于设定阈值,则将所述候选问答组加入低优先级列表。结合第一方面,本专利技术实施例在第一方面的第四种实现方式中,获取所述搜索问题与所述候选问题的第一相关性指标,包括以下方式的至少一种:计算所述搜索问题与所述候选问题的词级别TF-IDF相似性;计算所述搜索问题与所述候选问题的字符级别TF-IDF相似性;计算所述搜索问题与所述候选问题的汉字拼音级别TF-IDF相似性;计算所述搜索问题与所述候选问题的深度问题相似性;计算所述搜索问题与所述候选问题的词向量相似性;计算所述搜索问题与所述候选问题的潜在语义索引相似性。结合第一方面,本专利技术实施例在第一方面的第五种实现方式中,获取所述搜索问题与所述候选答案的第二相关性指标,包括以下方式的至少一种:计算所述搜索问题与所述候选答案的深度问答相关性;计算所述搜索问题与所述候选答案的词级别TF-IDF相关性;计算所述搜索问题与所述候选答案的字符级别TF-IDF相关性;计算所述搜索问题与所述候选答案的汉字拼音级别TF-IDF相关性;计算所述搜索问题与所述候选答案的词向量相关性;计算所述搜索问题与所述候选答案的潜在语义索引相关性。第二方面,本专利技术实施例提供了一种搜索结果排序装置,包括:第一排序模块,用于从第一排序结果中获取用户请求和候选结果,所述用户请求中包括搜索问题,所述候选结果中包括候选问题和每个候选问题对应的候选答案;第一相关性模块,用于获取所述搜索问题与所述候选问题的第一相关性指标;第二相关性模块,用于获取所述搜索问题与所述候选答案的第二相关性指标;第二排序模块,用于根据所述第一相关性指标和所述第二相关性指标,对所述第一排序结果进行重排序,得到第二排序结果。结合第二方面,本专利技术实施例在第二方面的第一种实现方式中,所述第二排序模块包括:高优先级子模块,用于根据所述第一相关性指标确定高优先级列表中包括的候选问答组;低优先级子模块,用于根据所述第二相关性指标确定低优先级列表中包括的候选问答组;合并排序子模块,用于将所述高优先级列表和所述低优先级列表中的候选问答组,按照高优先级在前、低优先级在后的顺序进行合并,得到所述第二排序结果。结合第二方面的第一种实现方式,本专利技术实施例在第二方面的第二种实现方式中,所述高优先级子模块还用于如果一个候选问答组的至少一个第一相关性指标高于设定阈值,则将所述候选问答组加入高优先级列表。结合第二方面的第一种实现方式,本专利技术实施例在第二方面的第三种实现方式中,所述低优先级子模块还用于如果一个候选问答组的至少一个第二相关性指标高于设定阈值,则将所述候选问答组加入低优先级列表。结合第二方面,本专利技术实施例在第二方面的第四种实现方式中,所述第一相关性模块包括以下子模块的至少一个:第一词级别子模块,用于计算所述搜索问题与所述候选问题的词级别TF-IDF相似性;第一字符级别子模块,用于计算所述搜索问题与所述候选问题的字符级别TF-IDF相似性;第一汉字拼音级别子模块,用于计算所述搜索问题与所述候选问题的汉字拼音级别TF-IDF相似性;深度问题子模块,用于计算所述搜索问题与所述候选问题的深度问题相似性;第一词向量子模块,用于计算所述搜索问题与所述候选问题的词向量相似性;第一潜在语义索引子模块,用于计算所述搜索问题与所述候选问题的潜在语义索引相似性。结合第二方面,本专利技术实施例在第二方面的第五种实现方式中,所述第二相关性模块包括以下子模块的至少一个:深度问答子模块,用于计算所述搜索问题与所述候选答案的深度问答相关性;第二词级别子模块,用于计算所述搜索问题与所述候选答案的词级别TF-IDF相关性;第二字符级别子模块,用于计算所述搜索问题与所述候选答案的字符级别TF-IDF相关性;第二汉字拼音级别子模块,用于计算所述搜索问题与所述候选答案的汉字拼音级别TF-IDF相关性;第二词向量子模块,用于计算所述搜索问题与所述候选答案的词向量相关性;第二潜在语义索引子模块,用于计算所述搜索问题与所述候选答案的潜在语义索引相关性。第三方面,本专利技术实施例提供了一种搜索结果排序装置,所述装置的功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。在一个可能的设计中,搜索结果排序装置的结构中包括处理器和存储器,所述存储器用于存储支持搜索结果排序装置执行上述搜索结果排序方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。所述搜索结果排序装置还可以包括通信接口,用于搜索结果排序装置与其他设备或通信网络通信。第四方面,本专利技术实施例提供了一种计算机可读存储介质,用于存储搜索结果排序装置所用的计算机软件指令,其包括用于执行上述搜索结果本文档来自技高网...

【技术保护点】
1.一种搜索结果排序方法,其特征在于,包括:从第一排序结果中获取用户请求和候选结果,所述用户请求中包括搜索问题,所述候选结果中包括候选问题和每个候选问题对应的候选答案;获取所述搜索问题与所述候选问题的第一相关性指标;获取所述搜索问题与所述候选答案的第二相关性指标;根据所述第一相关性指标和所述第二相关性指标,对所述第一排序结果进行重排序,得到第二排序结果。

【技术特征摘要】
1.一种搜索结果排序方法,其特征在于,包括:从第一排序结果中获取用户请求和候选结果,所述用户请求中包括搜索问题,所述候选结果中包括候选问题和每个候选问题对应的候选答案;获取所述搜索问题与所述候选问题的第一相关性指标;获取所述搜索问题与所述候选答案的第二相关性指标;根据所述第一相关性指标和所述第二相关性指标,对所述第一排序结果进行重排序,得到第二排序结果。2.根据权利要求1所述的方法,其特征在于,根据所述第一相关性指标和所述第二相关性指标,对所述第一排序结果进行重排序,得到第二排序结果,包括:根据所述第一相关性指标确定高优先级列表中包括的候选问答组;根据所述第二相关性指标确定低优先级列表中包括的候选问答组;将所述高优先级列表和所述低优先级列表中的候选问答组,按照高优先级在前、低优先级在后的顺序进行合并,得到所述第二排序结果。3.根据权利要求2所述的方法,其特征在于,根据所述第一相关性指标确定高优先级列表中包括的候选问答组,包括:如果一个候选问答组的至少一个第一相关性指标高于设定阈值,则将所述候选问答组加入高优先级列表。4.根据权利要求2所述的方法,其特征在于,根据所述第二相关性指标确定低优先级列表中包括的候选问答组,包括:如果一个候选问答组的至少一个第二相关性指标高于设定阈值,则将所述候选问答组加入低优先级列表。5.根据权利要求1所述的方法,其特征在于,获取所述搜索问题与所述候选问题的第一相关性指标,包括以下方式的至少一种:计算所述搜索问题与所述候选问题的词级别TF-IDF相似性;计算所述搜索问题与所述候选问题的字符级别TF-IDF相似性;计算所述搜索问题与所述候选问题的汉字拼音级别TF-IDF相似性;计算所述搜索问题与所述候选问题的深度问题相似性;计算所述搜索问题与所述候选问题的词向量相似性;计算所述搜索问题与所述候选问题的潜在语义索引相似性。6.根据权利要求1所述的方法,其特征在于,获取所述搜索问题与所述候选答案的第二相关性指标,包括以下方式的至少一种:计算所述搜索问题与所述候选答案的深度问答相关性;计算所述搜索问题与所述候选答案的词级别TF-IDF相关性;计算所述搜索问题与所述候选答案的字符级别TF-IDF相关性;计算所述搜索问题与所述候选答案的汉字拼音级别TF-IDF相关性;计算所述搜索问题与所述候选答案的词向量相关性;计算所述搜索问题与所述候选答案的潜在语义索引相关性。7.一种搜索结果排序装置,其特征在于,包括:第一排序模块,用于从第一排序结果中获取用户请求和候选结果,所述用户请求中包括搜索问题,所述候选结果中包括候选问题和每个候选问题对应的候选答案;第一相关性模块,用于获取所述搜索问题与所述候选问题的第一相关性指标;第二相关性模块,用于获取所...

【专利技术属性】
技术研发人员:施振辉陈俊周景博范斌罗程亮
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1