支持多知识来源的询问答复方法、装置和电子设备制造方法及图纸

技术编号:29401081 阅读:20 留言:0更新日期:2021-07-23 22:38
本发明专利技术提供一种支持多知识来源的询问答复方法、装置和电子设备,包括:确定询问语句文本;将所述询问语句文本分别输入多个答复单元,得到每个答复单元输出的回复,其中,所述多个答复单元均为互不相同知识来源的询问答复单元;以预设决策规则处理所有答复单元的回复,输出答复语句。本发明专利技术提供的方法、装置和电子设备,实现了基于多知识来源对用户询问语句做出最优答复。

【技术实现步骤摘要】
支持多知识来源的询问答复方法、装置和电子设备
本专利技术涉及自动答复
,尤其涉及一种支持多知识来源的询问答复方法、装置和电子设备。
技术介绍
随着近年来互联网的高速发展,网络购物在人们生活中扮演的角色也越来越重要了。用户通过网络了解产品信息的最常见形式是浏览商家的宣传页或是产品详细信息页面,这种方式有自己的局限性,用户需要对大量的信息进行浏览和比较才能获得自己想要的信息,导致用户并不能得到满意的体验。在用户需要有针对性的信息时,往往需要咨询售前客服,用自己的语言向售前客服人员咨询产品信息,然后客服人员通过自身经验或查阅相关信息页面或文档之后对用户问题进行回答。人工回答用户的问题存在一些缺点。由于人的生理限制,对于用户的问题往往需要较长的时间来进行阅读、思考和回复,很难做到“秒回”,且长时间的客服工作会导致人出错的机率增加。此外,随着用户数量的增长,一个客服人员往往需要同时与多个用户进行问答对话,客服人员不足时还需要雇佣更多的客服人员,这些情况使得的客服的成本随之增长。为了应对这些情况,问答系统应运而生。问答系统是一种计算机程序,它会尝试去理解用户提出的问题,并且利用近似于人类风格的自然语言来迅速地、准确地且便于人理解地进行回答。将问答系统用于产品信息的问答,可以进一步地满足用户需求,实现高效准确地问答、劳动力的解放和客服成本的降低。针对具体的行业和领域,通常会存在一些现成的知识,如非结构化或者半结构化的产品信息文档或者是结构化的产品信息数据库等,有些领域会存在一些针对用户常见问题编写的问答对。通过利用这些来源的知识,可以构建问答系统来回答用户的问题。现有的问答系统,通常只利用到了常用问题答案对或是某种知识数据库之一作为知识来源,且其中的很多系统是采用了基于人工编写规则或是基于规则和简单机器学习模型的技术路线,导致了能够回答的问题范围较小、回答准确率难以提升的问题。且许多行业领域通常会同时拥有多种形式的信息和知识,基于单一知识来源的问答系统无法充分利用行业领域现有的知识。因此,如何避免现有的问答系统知识来源单一,无法考虑当前行业领域内的多种形式的信息和知识的情形,仍然是本领域技术人员亟待解决的问题。
技术实现思路
本专利技术提供一种支持多知识来源的询问答复方法、装置和电子设备,用以解决现有的问答系统知识来源单一,无法考虑当前行业领域内的多种形式的信息和知识的问题,通过采用多种知识来源的答复单元对输入的询问语句作答输出多种回复,然后使用预设的决策规则从上述多种回复中选择或者融合得到最终的答复语句并输出,由于不再使用单一的知识来源对询问语句作答,而是至少两种知识来源的回复单元都处理询问语句并输出回复,最终按照针对选择的知识来源的回复单元特性制定的融合决策将多种回复进行筛选和/或融合,输出最优的答复语句。本专利技术提供一种支持多知识来源的询问答复方法,包括:确定询问语句文本;将所述询问语句文本分别输入多个答复单元,得到每个答复单元输出的回复,其中,所述多个答复单元均为互不相同知识来源的询问答复单元;以预设决策规则处理所有答复单元的回复,输出答复语句。根据本专利技术提供的一种支持多知识来源的询问答复方法,所述多个答复单元包括第一答复单元、第二答复单元和第三答复单元,对应地,所述第一答复单元采用基于文本相似度匹配的知识来源进行答复输出第一回复,所述第二答复单元采用基于知识图谱的知识来源进行答复输出第二回复,所述第三答复单元采用基于机器阅读理解的知识来源进行答复输出第三回复。根据本专利技术提供的一种支持多知识来源的询问答复方法,将所述询问语句文本输入第一答复单元,输出第一回复,具体包括:将所述询问语句文本输入文本嵌入式表示模型,输出询问语句特征矩阵;将所述询问语句特征矩阵与预先构建的常见问答库中的任一问题对应的特征向量输入第一相似度模型,输出对应的第一相似度;确定所述第一相似度中数值最大的所述常见问答库中的问题对应的回复语句为第一回复;其中,所述文本嵌入式表示模型是基于样本询问语句文本采用BERT网络结构进行训练得到的,所述第一相似度模型是基于样本询问语句特征矩阵、样本所述常见问答库中问题对应的特征矩阵和相似度标签进行训练得到的。根据本专利技术提供的一种支持多知识来源的询问答复方法,将所述询问语句文本输入第二答复单元,输出第二回复,具体包括:将所述询问语句文本输入文本嵌入式表示模型,输出询问语句特征矩阵;将所述询问语句特征矩阵输入问题实体识别模型,输出询问语句关键词;将所述询问语句关键词填入预先编写模版生成查询语句,采用所述查询语句在预先构建的知识图谱数据库中进行查询,得到查询结果;将所述查询结果填入自然语言编写模版生成第二回复;其中,所述文本嵌入式表示模型是基于样本询问语句文本采用BERT网络结构进行训练得到的,所述问题实体识别模型是基于样本询问语句特征矩阵和对应的询问语句关键词标签进行训练得到的。根据本专利技术提供的一种支持多知识来源的询问答复方法,将所述询问语句文本输入第三答复单元,输出第三回复,具体包括:确定所述询问语句文本和预先构建的语料库中的任一相关文本的第二相似度;确定所述第二相似度降序排列中前预设个数的语料库中的相关文本的拼接文本为目标文本;将所述询问语句文本输入文本和所述目标文本均输入文本嵌入式表示模型,输出询问语句特征矩阵和目标文本特征矩阵;将所述询问语句特征矩阵和所述目标文本特征矩阵输入精选模型,输出答案文本的起始点和结束点;基于所述起始点、所述结束点和所述目标文本确定第三回复;其中,所述文本嵌入式表示模型是基于样本询问语句文本和样本目标文本采用BERT网络结构进行训练得到的,所述精选模型是基于样本目标文本、样本询问语句文本、对应样本目标文本上的起始点标签和结束点标签进行训练得到的。根据本专利技术提供的一种支持多知识来源的询问答复方法,所述确定所述询问语句文本和预先构建的语料库中的任一相关文本的第二相似度,具体包括:确定所述询问语句文本的询问语句TF-IDF特征,确定预先构建的语料库中的任一相关文本的相关文本TF-IDF特征;对所述询问语句TF-IDF特征和任一所述相关文本TF-IDF特征采用余弦相似度算法进行计算,确定所述询问语句文本和预先构建的语料库中的任一相关文本的第二相似度。根据本专利技术提供的一种支持多知识来源的询问答复方法,所述以预设决策规则处理所有答复单元的回复,输出答复语句,具体包括:若所述第一相似度中数值最大的第一相似度高于预设阈值,则确定所述第一回复为答复语句并输出;若所述第一相似度中数值最大的第一相似度不高于预设阈值且第二回复非空时,确定所述第二回复为答复语句并输出;若所述第一相似度中数值最大的第一相似度不高于预设阈值且第二回复为空,则确定所述第三回复为答复语句并输出。本专利技术还提供一种支持多知识来源的询问答复装置,包括:确定单元,用于确定询问语句本文档来自技高网
...

【技术保护点】
1.一种支持多知识来源的询问答复方法,其特征在于,包括:/n确定询问语句文本;/n将所述询问语句文本分别输入多个答复单元,得到每个答复单元输出的回复,其中,所述多个答复单元均为互不相同知识来源的询问答复单元;/n以预设决策规则处理所有答复单元的回复,输出答复语句。/n

【技术特征摘要】
1.一种支持多知识来源的询问答复方法,其特征在于,包括:
确定询问语句文本;
将所述询问语句文本分别输入多个答复单元,得到每个答复单元输出的回复,其中,所述多个答复单元均为互不相同知识来源的询问答复单元;
以预设决策规则处理所有答复单元的回复,输出答复语句。


2.根据权利要求1所述的支持多知识来源的询问答复方法,其特征在于,所述多个答复单元包括第一答复单元、第二答复单元和第三答复单元,对应地,
所述第一答复单元采用基于文本相似度匹配的知识来源进行答复输出第一回复,所述第二答复单元采用基于知识图谱的知识来源进行答复输出第二回复,所述第三答复单元采用基于机器阅读理解的知识来源进行答复输出第三回复。


3.根据权利要求2所述的支持多知识来源的询问答复方法,其特征在于,将所述询问语句文本输入第一答复单元,输出第一回复,具体包括:
将所述询问语句文本输入文本嵌入式表示模型,输出询问语句特征矩阵;
将所述询问语句特征矩阵与预先构建的常见问答库中的任一问题对应的特征向量输入第一相似度模型,输出对应的第一相似度;
确定所述第一相似度中数值最大的所述常见问答库中的问题对应的回复语句为第一回复;
其中,所述文本嵌入式表示模型是基于样本询问语句文本采用BERT网络结构进行训练得到的,所述第一相似度模型是基于样本询问语句特征矩阵、样本所述常见问答库中问题对应的特征矩阵和相似度标签进行训练得到的。


4.根据权利要求3所述的支持多知识来源的询问答复方法,其特征在于,将所述询问语句文本输入第二答复单元,输出第二回复,具体包括:
将所述询问语句文本输入文本嵌入式表示模型,输出询问语句特征矩阵;
将所述询问语句特征矩阵输入问题实体识别模型,输出询问语句关键词;
将所述询问语句关键词填入预先编写模版生成查询语句,采用所述查询语句在预先构建的知识图谱数据库中进行查询,得到查询结果;
将所述查询结果填入自然语言编写模版生成第二回复;
其中,所述文本嵌入式表示模型是基于样本询问语句文本采用BERT网络结构进行训练得到的,所述问题实体识别模型是基于样本询问语句特征矩阵和对应的询问语句关键词标签进行训练得到的。


5.根据权利要求4所述的支持多知识来源的询问答复方法,其特征在于,将所述询问语句文本输入第三答复单元,输出第三回复,具体包括:
确定所述询问语句文本和预先构建的语料库中的任一相关文本的第二相似度;
确定所述第二相似度降序排列中前预设个数的语料...

【专利技术属性】
技术研发人员:程渤赵帅韦翔晟陈俊亮
申请(专利权)人:北京邮电大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1