自动问答处理方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:26171110 阅读:39 留言:0更新日期:2020-10-31 13:41
本申请提出一种自动问答处理方法、装置、计算机设备及存储介质,其中,方法包括:获取用户输入的目标问题;利用预先训练的句子语义编码模型对所述目标问题进行语义向量化,获取所述目标问题的句子向量;计算所述句子向量与问答库中每个问题的语义索引向量之间的相似度;根据所述相似度从所述问答库中确定出与所述目标问题匹配的标准问题,并将所述标准问题对应的答案反馈给所述用户。通过本方法,能够实现基于问题的语义相关性进行问题匹配,提高对目标问题语义理解的准确率,解决现有技术中基于字面相关性进行问题匹配导致返回的答案无法满足用户需求,准确度低的技术问题。

【技术实现步骤摘要】
自动问答处理方法、装置、计算机设备及存储介质
本申请涉及自动问答
,尤其涉及一种自动问答处理方法、装置、计算机设备及存储介质。
技术介绍
自动问答系统综合运用知识表示、信息检索、自然语言处理等技术,能够根据接收的用户以自然语言形式输入的问题,返回简洁而准确的答案。自动问答系统相比于传统的搜索引擎,具有更方便、更准确的优点,是当前自然语言处理及人工智能领域的研究热点。传统的自动问答系统通常采用基于单词的倒排索引技术对用户输入的问题进行检索并返回匹配的答案。然而,这种方式是基于问题的字面相关性进行问题匹配的,并未关注用户的真正意图,从而导致返回的答案无法满足用户的需求,影响自动问答系统的准确度。
技术实现思路
本申请旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本申请提出一种自动问答处理方法、装置、计算机设备及存储介质,用于解决现有技术中基于字面相关性进行问题匹配导致返回的答案无法满足用户需求,准确度低的技术问题。为达上述目的,本申请第一方面实施例提出了一种自动问答处理方法,包括:本文档来自技高网...

【技术保护点】
1.一种自动问答处理方法,其特征在于,包括:/n获取用户输入的目标问题;/n利用预先训练的句子语义编码模型对所述目标问题进行语义向量化,获取所述目标问题的句子向量;/n计算所述句子向量与问答库中每个问题的语义索引向量之间的相似度;/n根据所述相似度从所述问答库中确定出与所述目标问题匹配的标准问题,并将所述标准问题对应的答案反馈给所述用户。/n

【技术特征摘要】
1.一种自动问答处理方法,其特征在于,包括:
获取用户输入的目标问题;
利用预先训练的句子语义编码模型对所述目标问题进行语义向量化,获取所述目标问题的句子向量;
计算所述句子向量与问答库中每个问题的语义索引向量之间的相似度;
根据所述相似度从所述问答库中确定出与所述目标问题匹配的标准问题,并将所述标准问题对应的答案反馈给所述用户。


2.如权利要求1所述的方法,其特征在于,在所述利用预先训练的句子语义编码模型对所述目标问题进行语义向量化,获取所述目标问题的句子向量之前,还包括:
获取训练样本集,其中,所述训练样本集包括多个问题和与每个问题对应的向量;
利用所述训练样本集对神经网络模型进行训练,生成所述句子语义编码模型。


3.如权利要求1所述的方法,其特征在于,在所述计算所述句子向量与问答库中每个问题的语义索引向量之间的相似度之前,还包括:
利用所述句子语义编码模型对所述问答库中的每个问题进行语义向量化,获取所述问答库中每个问题对应的问题向量;
基于近似近邻检索和所述问题向量,确定所述问答库中每个问题对应的语义索引向量。


4.如权利要求1所述的方法,其特征在于,所述根据所述相似度从所述问答库中确定出与所述目标问题匹配的标准问题,包括:
按照所述相似度从高到低的顺序对所述问答库中的每个问题进行排序,获取排名靠前的预设个数的问题作为候选问题;
利用预先训练的问答排序模型获取所述目标问题与所述候选问题之间的问题相似度;
将所述问题相似度最高值对应的候选问题确定为所述标准问题。


5.如权利要求4所述的方法,其特征在于,所述问答排序模型包括循环神经网络层、注意力层和输出层;
所述利用预先训练的问答排序模型获取所述目标问题与所述候选问题之间的问题相似度,包括:
将所述目标问题和所述候选问题输入所述循环神经网络层,以获取所述目标问题对应的目标问题特征矩阵和所述候选问题对应的候选问题特征矩阵;
将所述目标问题特征矩阵和...

【专利技术属性】
技术研发人员:黄强卜建辉陈林吴伟佳谢炜坚
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1