一种问答知识库扩充方法、问答方法及相关设备技术

技术编号:38435034 阅读:7 留言:0更新日期:2023-08-11 14:20
本申请提供一种问答知识库扩充方法、问答方法及相关设备,所述问答知识库扩充方法包括:使用第一模型对第一问题进行相似问题预测,以得到第一问题的相似问题;基于所述相似问题,扩充问答知识库,所述问答知识库包括第一问题。本申请可以提高问答知识库扩充的效率。率。率。

【技术实现步骤摘要】
一种问答知识库扩充方法、问答方法及相关设备


[0001]本申请涉及智能问答
,尤其涉及一种问答知识库扩充方法、问答方法及相关设备。

技术介绍

[0002]现有的问答技术中,多数是基于知识库实现常见问题解答(Frequently Asked Questions,FAQ),即根据领域知识梳理标准问题和用户问题,构建问答知识库,再采用检索方式或者机器学习问答模型训练的方式为用户问题找到最相似的标准问题,再将标准问题对应的答案作为问题的答案。在问答知识库中数据较少的情况下,需人工进行标注并扩充,效率较低。

技术实现思路

[0003]本申请提供一种问答知识库扩充方法、问答方法及相关设备,以解决问答知识库扩充效率较低的问题。
[0004]第一方面,本申请实施例提供了一种问答知识库扩充方法,包括:
[0005]使用第一模型对第一问题进行相似问题预测,以得到第一问题的相似问题;
[0006]基于所述相似问题,扩充问答知识库,所述问答知识库包括第一问题。
[0007]第二方面,本申请提供一种问答方法,包括:
[0008]获取目标问题;
[0009]基于问答知识库,预测所述目标问题的答案,其中,所述问答知识库为根据第一方面所述的方法进行扩充后的问答知识库。
[0010]第三方面,本申请实施例还提供一种问答知识库扩充装置,包括:
[0011]第一预测模块,用于使用第一模型对第一问题进行相似问题预测,以得到第一问题的相似问题;
[0012]扩充模块,用于基于所述相似问题,扩充问答知识库,所述问答知识库包括第一问题。
[0013]第四方面,本申请还提供一种问答装置,包括:
[0014]获取模块,用于获取目标问题;
[0015]第二预测模块,用于基于问答知识库,预测所述目标问题的答案,所述问答知识库为根据第一方面所述的方法进行扩充后的问答知识库。
[0016]第五方面,本申请实施例还提供一种电子设备,包括:收发机、存储器、处理器及存储在所述存储器上并可在所述处理器上运行的程序;所述处理器,用于读取存储器中的程序实现如本申请实施例第一方面所述方法中的步骤,或者实现如本申请实施例第二方面所述方法中的步骤。
[0017]第六方面,本申请实施例还提供一种可读存储介质,所述可读存储介质上存储程序,所述程序被处理器执行时实现如本申请实施例第一方面所述方法中的步骤,或者实现
如本申请实施例第二方面所述方法中的步骤。
[0018]这样,本申请实施例中,通过使用第一模型对第一问题进行相似问题预测,以得到第一问题的相似问题,并基于所述相似问题,扩充所述问答知识库,即可以增加问答知识库的数据量,在问答知识库中的原始数据较少的情况下,也可以通过相似问题预测的方式对所述问答知识库进行扩充,从而提高所述问答知识库扩充的效率。
附图说明
[0019]为了更清楚地说明本申请的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0020]图1是本申请实施例提供的一种问答知识库扩充方法的流程示意图;
[0021]图2是本申请实施例提供的一种问答方法的流程示意图;
[0022]图3是本申请实施例提供的一种智能问答的流程示意图;
[0023]图4是本申请实施例提供的一种深度文本数据增强方法的示意图;
[0024]图5是本申请实施例提供的一种预测模型的示意图;
[0025]图6是本申请实施例提供的一种问答知识库扩充装置的结构示意图;
[0026]图7是本申请实施例提供的一种问答装置的结构示意图;
[0027]图8是本申请实施例提供的电子设备的结构示意图之一;
[0028]图9是本申请实施例提供的电子设备的结构示意图之二。
具体实施方式
[0029]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0030]本申请实施例中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。此外,本申请中使用“和/或”表示所连接对象的至少其中之一,例如A和/或B和/或C,表示包含单独A,单独B,单独C,以及A和B都存在,B和C都存在,A和C都存在,以及A、B和C都存在的7种情况。
[0031]请参阅图1,图1是本申请实施例提供的一种问答知识库扩充方法的流程示意图,如图1所示,包括以下步骤:
[0032]步骤101、使用第一模型对第一问题进行相似问题预测,以得到第一问题的相似问题。
[0033]可以理解,上述第一问题的相似问题与上述第一问题的答案一致,也即上述第一问题的相似问题与上述第一问题实质上要问的问题是一致的,例如:以上述第一问题为“地
点A在哪儿”为例,上述第一问题的相似问题可以是“地点A在什么地方”、“地点A的地址是什么”等问题,上述问题的实质均为对地点A的位置(或地址)的提问,对应的答案均为“地点A的位置(或地址)”。
[0034]其中,上述第一模型可以是预先训练好的模型,通过使用预先训练的第一模型对第一问题进行预测,以得到第一问题的相似问题,且相似问题可以包括多个。对问答对中的原始问题进行预测得到预测问题后,该预测问题的答案即为原始问题的答案,也即问答对中的答案可以对应多个问题。
[0035]可选地,所述第一模型通过如下方式训练得到:
[0036]获取无监督数据,以及无监督数据的增强数据;
[0037]分别使用所述无监督数据,以及所述无监督数据的增强数据对第二模型进行训练,以得到第一损失值;
[0038]获取有监督数据;
[0039]使用所述有监督数据对所述第二模型进行训练,以得到第二损失值;
[0040]基于所述第一损失值和所述第二损失值,调整所述第二模型的模型参数,以得到所述第一模型。
[0041]其中,上述无监督数据的增强数据可以通过多种方式获取得到,例如:可以直接调用在线翻译接口,实现翻译增强;或者通过计算词频对高频词进行同义词替换等得到上述增强数据。可以理解,上述无监督数据的增强数据也是无监督的数据,即上述第一损失值为无监督学习过程中得到的损失值。
[0042]在一些实施例中,上述第二模型可以由变压器的双向编码本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种问答知识库扩充方法,其特征在于,包括:使用第一模型对第一问题进行相似问题预测,以得到第一问题的相似问题;基于所述相似问题,扩充问答知识库,所述问答知识库包括第一问题。2.如权利要求1所述的方法,其特征在于,所述第一模型通过如下方式训练得到:获取无监督数据,以及无监督数据的增强数据;分别使用所述无监督数据,以及所述无监督数据的增强数据对第二模型进行训练,以得到第一损失值;获取有监督数据;使用所述有监督数据对所述第二模型进行训练,以得到第二损失值;基于所述第一损失值和所述第二损失值,调整所述第二模型的模型参数,以得到所述第一模型。3.如权利要求2所述的方法,其特征在于,所述分别使用所述无监督数据,以及所述无监督数据的增强数据对第二模型进行训练,以得到第一损失值,包括:使用所述第二模型对所述无监督数据进行相似问题预测,以得到第二问题;使用所述第二模型对所述增强数据进行相似问题预测,以得到第三问题;基于所述第二问题和所述第三问题,确定所述第一损失值。4.如权利要求3所述的方法,其特征在于,所述基于所述第二问题和所述第三问题,确定所述第一损失值之后,所述方法还包括:在所述第一损失值小于预设阈值的情况下,将所述无监督数据以及对应的增强数据添加至所述有监督数据中。5.如权利要求2至4中任一项所述的方法,其特征在于,所述获取无监督数据,以及无监督数据的增强数据,包括:获取无监督数据;基于数据增强方式,获取所述无监督数据的增强数据;其中,所述数据增强方式包括如下至少一项:对所述无监督数据进行回译;将所述无监督数据中的第一词同义替换为第二词,其中,在所述同义替换的过程中,所述第一词为第一预设词集合以外的词,所述第二词为第二预设词集合以外的词;获取问题的提问模式,所述提问模式用于生成所述无监督数据的增强数据。6.一种问答方法,其特征在于,包括:获取目标问题;基于问答知识库,预测所述目标问题的答案,其中,所述问答知识库为根据权利要求1至5中任一项所述的方法进行扩充后的问答知识库。7.如权利要求6所述的方法,其特征在于,所述基于问答知识库,预测所述目标问题的答案,包括:基于所述问答知识库...

【专利技术属性】
技术研发人员:殷丹平孟繁宇胡珉邓超
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1