用于问答系统的语义匹配方法、装置、设备及存储介质制造方法及图纸

技术编号:22135289 阅读:25 留言:0更新日期:2019-09-18 09:00
本公开提供了一种用于问答系统的语义匹配方法,包括:识别输入至问答系统中的输入问题的主语词;基于识别出的主语词,在问答对库中进行搜索,以筛选出问答对库中包含主语词的问答对;基于筛选出的问答对,进行输入问题与得到问答对中的问答对问题之间的语义匹配;以及判断问答对问题与输入问题的语义匹配结果是否大于或等于预定阈值,在大于或等于预定阈值的情况下,将问答对问题所对应的答案作为输入问题的答案。本公开还提供了一种用于问答系统的语义匹配装置、电子设备及可读存储介质。

Semantic Matching Method, Device, Equipment and Storage Medium for Question Answering System

【技术实现步骤摘要】
用于问答系统的语义匹配方法、装置、设备及存储介质
本公开涉及一种用于问答系统的语义匹配方法、用于问答系统的语义匹配装置、电子设备及可读存储介质。
技术介绍
现有的问答系统在实现过程,通过是通过将用户的问题与问答库内容进行匹配而实现的。问答库匹配时,会计算输入的一个问题(query)与问答库中所有的问题的相似度,然后给出那个得分最高的问题的答案,其是一个语义匹配的过程。在语义匹配中,通常可能会设定一个阈值,当最高的那个问题的得分高于这个阈值的时候,则输出最高分问题的答案;小于时,则认为没有匹配到合适的问题,不提供答案。这样就存在阈值选择的问题,如果阈值设置地很高,那么很少有query能够匹配出答案;如果阈值设置地很低,很容易出现误召回的现象。如用户输入query问:“儒家的创始人是谁”,因为问答库中有一个问答对是“佛教的创始人是谁”---“释迦摩尼”,第三个字以后完全相似,并且儒家和佛教是比较相似的词,所以很容易误召回;另一个例子是“帮我搜一下北京到上海的火车”,和“帮我搜一下上海到北京的火车”,两个句子词完全一致,用户意图也相差不多,只是目的地和出发地对换,通过语义匹配不太能够分辨出来。这种query对于语义匹配来说语义是相似的,但从语义解析任务的角度来说却完全不同。
技术实现思路
为了解决上述技术问题中的至少一个,本公开提供了一种用于问答系统的语义匹配方法、用于问答系统的语义匹配装置、电子设备及可读存储介质。根据本公开的一个方面,一种用于问答系统的语义匹配方法,包括:识别输入至所述问答系统中的输入问题的主语词;基于识别出的所述主语词,在问答对库中进行搜索,以筛选出问答对库中包含所述主语词的问答对;基于筛选出的所述问答对,进行所述输入问题与得到所述问答对中的问答对问题之间的语义匹配;以及判断所述问答对问题与所述输入问题的语义匹配结果是否大于或等于预定阈值,在大于或等于所述预定阈值的情况下,将所述问答对问题所对应的答案作为输入问题的答案。根据本公开的至少一个实施方式,识别输入至所述问答系统中的输入问题的主语词时,基于字向量特征来识别所述主语词。根据本公开的至少一个实施方式,识别输入至所述问答系统中的输入问题的主语词时,还包括:按照输入基于字向量特征的神经网络中的字顺序来为每个字顺序地标注下标,通过基于字向量特征的神经网络来预测主语词的起始下标和终止下标。根据本公开的至少一个实施方式,当所述神经网络预测出所述主语词的起始下标及终止下标之后,遍历所述输入问题,得到所述主语词。根据本公开的至少一个实施方式,在进行所述输入问题与所述问答对的集合中的问答对问题之间的语义匹配时,判断所述输入问题与所述问答对问题之间的语义相似度;以及所述问答对问题与所述输入问题的语义匹配结果大于或等于预定阈值的情况为:所述问答对问题与所述输入问题的语义相似度大于或等于预定阈值的情况。根据本公开的至少一个实施方式,进行所述输入问题与所述问答对的集合中的问答对问题之间的语义匹配之后,且在判断所述问答对问题与所述输入问题的语义匹配结果是否大于或等于预定阈值之前,还包括:选择语义匹配结果最高的问答对问题,其中,在判断所述问答对问题与所述输入问题的语义匹配结果是否大于或等于预定阈值时,确定语义匹配结果最高的问答对问题与所述输入问题的语义匹配结果是否大于或等于预定阈值。根据本公开的至少一个实施方式,基于筛选出的所述问答对形成问答对临时库,并且在所述问答对临时库中进行所述输入问题与得到所述问答对中的问答对问题之间的语义匹配。根据本公开的另一方面,一种用于问答系统的语义匹配装置,包括:识别模块,用于识别输入至所述问答系统中的输入问题的主语词;筛选模块,基于识别出的所述主语词,在问答对库中进行搜索,以筛选出问答对库中包含所述主语词的问答对;匹配模块,基于筛选出的所述问答对,进行所述输入问题与得到所述问答对中的问答对问题之间的语义匹配;以及判断模块,判断所述问答对问题与所述输入问题的语义匹配结果是否大于或等于预定阈值,在大于或等于所述预定阈值的情况下,将所述问答对问题所对应的答案作为输入问题的答案。根据本公开的再一方面,一种电子设备,包括:存储器,所述存储器存储执行指令;以及处理器,所述处理器执行所述存储器存储的执行指令,使得所述处理器执行如上所述的方法。根据本公开的又一方面,一种计算机刻度存储介质,所述可读存储介质中存储有执行指令,所述执行指令被处理器执行时用于实现如上所述的方法。附图说明附图示出了本公开的示例性实施方式,并与其说明一起用于解释本公开的原理,其中包括了这些附图以提供对本公开的进一步理解,并且附图包括在本说明书中并构成本说明书的一部分。图1是根据本公开一个实施方式的用于问答系统的语义匹配方法的流程图。图2是根据本公开一个实施方式的用于问答系统的语义匹配方法中的主语识别处理方法的流程图。图3是根据本公开一个实施方式的用于问答系统的语义匹配方法中的主语识别处理方法的神经网络的示意图。图4是根据本公开一个实施方式的用于问答系统的语义匹配方法中的问答对筛选的流程图。图5是根据本公开一个实施方式的用于问答系统的语义匹配装置的示意性框图。图6是根据本公开一个实施方式的电子设备的示意性视图。具体实施方式下面结合附图和实施方式对本公开作进一步的详细说明。可以理解的是,此处所描述的具体实施方式仅用于解释相关内容,而非对本公开的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本公开相关的部分。需要说明的是,在不冲突的情况下,本公开中的实施方式及实施方式中的特征可以相互组合。下面将参考附图并结合实施方式来详细说明本公开。问答系统(questionanswersystem,简称QA系统),是用来回答用户输入或提出的各种各样的问题。比如用户提问“中国的国土面积是多少”,QA系统回答“960万平方公里”;用户提问“中国有多少人口”,QA系统回答“13亿”。问答对(questionanswerpair),是指已经存储好的问题和问答对。比如:美国总统是谁---美国总统是特朗普,日本首相是谁---日本首相是安倍晋三。语义匹配(semanticmatching),是指衡量两个句子在语义层面的相似度。语义解析(semanticparsing),是指对句子,转换为机器可解析的语义表达。比如:“明天天气怎么样”,通过语义解析,根据这句话,用户的意图是问天气,其中问的时间是“明天”,地点没有说,可以采用默认地点,即用户所在城市作为默认地点;又如:“特朗普的妻子是谁”,解析出问题的主语是“特朗普”,想要问的属性是“妻子”,等等。根据本公开的一个实施方式,提供了一种用于问答系统的语义匹配方法。如图1所示,该用于问答系统的语义匹配方法可以包括:步骤S10,识别输入至问答系统中的输入问题的主语词;S20,筛选出问答对库中包含主语词的问答对;S30,进行输入问题与得到的问答对中的问答对问题之间的语义匹配;以及S40,判断问答对问题与输入问题的语义匹配结果是否大于或等于预定阈值。在步骤S10中,识别输入至问答系统中的输入问题的主语词。可选地,用户输入的问题进入问答系统后,经过分词、词性标注等预处理后,可以进入主语识别模块,来识别问题的主语。其中,主语识别模块可以通过基于字向本文档来自技高网...

【技术保护点】
1.一种用于问答系统的语义匹配方法,其特征在于,包括:识别输入至所述问答系统中的输入问题的主语词;基于识别出的所述主语词,在问答对库中进行搜索,以筛选出问答对库中包含所述主语词的问答对;基于筛选出的所述问答对,进行所述输入问题与得到所述问答对中的问答对问题之间的语义匹配;以及判断所述问答对问题与所述输入问题的语义匹配结果是否大于或等于预定阈值,在大于或等于所述预定阈值的情况下,将所述问答对问题所对应的答案作为输入问题的答案。

【技术特征摘要】
1.一种用于问答系统的语义匹配方法,其特征在于,包括:识别输入至所述问答系统中的输入问题的主语词;基于识别出的所述主语词,在问答对库中进行搜索,以筛选出问答对库中包含所述主语词的问答对;基于筛选出的所述问答对,进行所述输入问题与得到所述问答对中的问答对问题之间的语义匹配;以及判断所述问答对问题与所述输入问题的语义匹配结果是否大于或等于预定阈值,在大于或等于所述预定阈值的情况下,将所述问答对问题所对应的答案作为输入问题的答案。2.如权利要求1所述的方法,其特征在于,识别输入至所述问答系统中的输入问题的主语词时,基于字向量特征来识别所述主语词。3.如权利要求2所述的方法,其特征在于,识别输入至所述问答系统中的输入问题的主语词时,还包括:按照输入基于字向量特征的神经网络中的字顺序来为每个字顺序地标注下标,通过基于字向量特征的神经网络来预测主语词的起始下标和终止下标。4.如权利要求3所述的方法,其特征在于,当所述神经网络预测出所述主语词的起始下标及终止下标之后,基于所述起始下标及终止下标,遍历所述输入问题,得到所述主语词。5.如权利要求1至4中任一项所述的方法,其特征在于,在进行所述输入问题与所述问答对的集合中的问答对问题之间的语义匹配时,判断所述输入问题与所述问答对问题之间的语义相似度;以及所述问答对问题与所述输入问题的语义匹配结果大于或等于预定阈值的情况为:所述问答对问题与所述输入问题的语义相似度大于或等于预定阈值的情况。6.如权利要求1至5中任一项所述的方法,其特征在于,进行所述输入...

【专利技术属性】
技术研发人员:岳聪
申请(专利权)人:出门问问信息科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1