一种问答识别方法以及相关设备技术

技术编号:33545506 阅读:54 留言:0更新日期:2022-05-26 22:39
本申请提供了一种问答识别方法以及相关设备。首先,获取目标问答对,然后,将目标问答对输入目标问答模型,目标问答模型的损失函数由分类模块的第一损失函数、答案抽取模块的第二损失函数以及答案识别模块的第三损失函数得到。最后,输出答案库中是否包括目标问题所对应的目标答案。由此可鉴,目标问答模型针对问题作答时结合了分类模块、答案抽取模块以及答案识别模块的特征,通过协同不同粒度的语义,提升对话问答的准确率。提升对话问答的准确率。提升对话问答的准确率。

【技术实现步骤摘要】
一种问答识别方法以及相关设备


[0001]本申请实施例涉及计算机领域,进一步涉及人工智能(artificial intelligence,AI)技术在计算机领域中的应用,尤其是一种问答识别方法以及相关设备。

技术介绍

[0002]人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式作出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。人工智能领域的研究包括机器人,自然语言处理,计算机视觉,决策与推理,人机交互,推荐与搜索,AI基础理论等。
[0003]问答是目前人工智能应用较为成功的场景之一,具体的应用场景有智能客服、对话系统、闲聊、百科等,在这些场景中,针对用户的输入(用户提问的问句),问答系统需要在答案库中找到与问句对应的答案并将其返回给用户,满足用户获取信息的服务。例如,在手机售后维修智能客服中,问答系统可以根据用户的提问找到维修用户手机故障的方法。在对话系统中,问答系统可以根据用户的提问找到之前用户主动让系统记住的备忘事件。在百科中,问答系统可以根据用户提问在百科中找到能回答用户问题的文章。因此,问答系统已经成为新的信息交互方式中非常重要的一部分。
[0004]在实际应用过程中,首先,问答库中答案之间可能会存在语义高度相关、语义较为相关和语义不相关等多种情况,这会要求问答系统能有效处理不同语义相关性的数据。其次,用户提问的问句可能非常细也可能非常粗,这同样会要求问答系统能理解不同粗细程度的问句。最后,用户询问的内容是开域,不限领域的,这要求问答系统能较好的处理不同领域间语义冲突的情况。综上,在现实应用场景中,对话问答数据从问句到答案库都更加复杂,如何有效处理这些数据是一个令人值得深思的问题。

技术实现思路

[0005]本申请实施例提供了一种问答识别方法以及相关设备,本申请中提供的目标问答模型针对问题作答时结合了分类模块、答案抽取模块以及答案识别模块的特征,通过协同不同粒度的语义,提升对话问答的准确率。
[0006]本申请实施例第一方面提供一种问答识别方法,该问答识别方法包括:获取目标问答对,所述目标问答对为目标问题与和与目标问题对应的备选答案组成的问答对;将所述目标问答对输入目标问答模型,所述目标问答模型的损失函数由分类模块的第一损失函数、答案抽取模块的第二损失函数以及答案识别模块的第三损失函数得到;输出答案库中是否包括目标问题所对应的目标答案,所述目标答案用于指示所述目标问题所对应的正确答案。
[0007]本申请中,首先,获取目标问答对,然后,将目标问答对输入目标问答模型,目标问答模型的损失函数由分类模块的第一损失函数、答案抽取模块的第二损失函数以及答案识别模块的第三损失函数得到。最后,输出答案库中是否包括目标问题所对应的目标答案。由此可鉴,目标问答模型针对问题作答时结合了分类模块、答案抽取模块以及答案识别模块的特征,通过协同不同粒度的语义,提升对话问答的准确率。
[0008]首先,获第一取训练样本数据集,然后,根据样本数据集对初始问答模型进行训练以得到目标问答模型,目标问答模型的损失函数由分类模块的第一损失函数、答案抽取模块的第二损失函数以及答案识别模块的第三损失函数得到。从而,目标问答模型针对问题作答时结合了分类模块、答案抽取模块以及答案识别模块的特征,通过协同不同粒度的语义,提升对话问答的准确率。
[0009]在第一方面一种可能的实现方式中,所述方法还包括:获取目标问题;对所述目标问题进行预处理;所述获取目标问答对,包括:根据预处理后的目标问题获取所述目标问答对。
[0010]本申请实施例提供的问答识别方法中,获取目标问题后,可以对从用户一方收集的问题进行基本的预处理,预处理的方式有多种。可选的,预处理的方式可以是停用词删除。由于停用词大部分都是连词等一些无意义的词语,这些停用词对后续关键词提取、备选答案预筛选等都有负面作用,因此,将这些停用词,如“的”、“地”、“我”等去掉有助于后续模型对目标问题的处理。可选的,预处理的方式可以是分词。分词主要是将用户问题形式化,突显出其中能表示其语义的关键词信息,这些关键词将对备选答案预筛选有积极作用。可选的,预处理的方式可以是问题类型判断。中文疑问句通常都较为复杂,问题类型也多种多样。根据应用场景的不同,可以支持不同的问题类型,与此同时,问题类型也会对答案输出产生一定的影响。因此,可以先对从用户一方收集的问题做类型判断,有助于后续模型处理目标问题。
[0011]在第一方面一种可能的实现方式中,所述方法还包括:获取所述目标问题中的关键词;根据所述关键词筛选所述备选答案;将目标问题与所述筛选后合格的备选答案组成所述目标问答对;所述将所述目标问答对输入问答模型,包括:将目标问题与所述筛选后合格的备选答案组成所述目标问答对输入所述问答模型。
[0012]本申请实施例中提供的问答识别方法,可以对备选答案进行预处理。备选答案预处理主要是针对用户提问时备选答案较多的情况下开展的。如在智能客服业务场景下,由于用户会遇到不同类型的问题,每种类型下又会细分出很多不同的问题及相应的解决方案,当用户提问时,答案空间大,筛选答案较为困难。此时,我们可以对备选答案进行预处理,增加答案与问题成功匹配的概率。
[0013]本申请实施例第二方面提供一种问答识别方法,该方法包括:获取训练样本数据集,所述训练样本数据集包括至少一个目标问答对,所述目标问答对为目标问题与和与目标问题对应的备选答案组成的问答对;根据所述训练样本数据集对初始问答模型进行训练以得到目标问答模型,所述目标问答模型的损失函数由分类模块的第一损失函数、答案抽取模块的第二损失函数以及答案识别模块的第三损失函数得到。
[0014]本申请中,首先,获第一取训练样本数据集,然后,根据样本数据集对初始问答模型进行训练以得到目标问答模型,目标问答模型的损失函数由分类模块的第一损失函数、
答案抽取模块的第二损失函数以及答案识别模块的第三损失函数得到。从而,目标问答模型针对问题作答时结合了分类模块、答案抽取模块以及答案识别模块的特征,通过协同不同粒度的语义,提升对话问答的准确率。
[0015]在第二方面一种可能的实现方式中,所述训练样本数据集包括第一样本数据集,所述方法还包括:根据所述第一样本数据集对初始答案识别模块进行训练以得到所述答案识别模块。
[0016]在第二方面一种可能的实现方式中,根据所述第一样本数据集对初始答案识别模块进行训练以得到所述答建模模块,包括:根据所述第一样本数据集获取第一语义隐表示,所述第一语义隐表示为所述答案识别模块根据所述第一样本数据集得到的语义向量;通过因式分解机FM对所述第一语义隐表示、第二语义隐表示以及第三语义隐表示协同本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种问答识别方法,其特征在于,包括:获取目标问答对,所述目标问答对为目标问题与和与目标问题对应的备选答案组成的问答对;将所述目标问答对输入目标问答模型,所述目标问答模型的损失函数由分类模块的第一损失函数、答案抽取模块的第二损失函数以及答案识别模块的第三损失函数得到;输出答案库中是否包括目标问题所对应的目标答案,所述目标答案用于指示所述目标问题所对应的正确答案。2.根据权利要求1所述的问答识别方法,其特征在于,所述方法还包括:获取目标问题;对所述目标问题进行预处理;所述获取目标问答对,包括:根据预处理后的目标问题获取所述目标问答对。3.根据权利要求1或2所述的问答识别方法,其特征在于,所述方法还包括:获取所述目标问题中的关键词;根据所述关键词筛选所述备选答案;将目标问题与所述筛选后合格的备选答案组成所述目标问答对;所述将所述目标问答对输入问答模型,包括:将目标问题与所述筛选后合格的备选答案组成所述目标问答对输入所述问答模型。4.一种模型训练方法,其特征在于,包括:获取训练样本数据集,所述训练样本数据集包括至少一个目标问答对,所述目标问答对为目标问题与和与目标问题对应的备选答案组成的问答对;根据所述训练样本数据集对初始问答模型进行训练以得到目标问答模型,所述目标问答模型的损失函数由分类模块的第一损失函数、答案抽取模块的第二损失函数以及答案识别模块的第三损失函数得到。5.根据权利要求4所述的模型训练方法,其特征在于,所述训练样本数据集包括第一样本数据集,所述方法还包括:根据所述第一样本数据集对初始答案识别模块进行训练以得到所述答案识别模块。6.根据权利要求5所述的模型训练方法,其特征在于,根据所述第一样本数据集对初始答案识别模块进行训练以得到所述答建模模块,包括:根据所述第一样本数据集获取第一语义隐表示,所述第一语义隐表示为所述答案识别模块根据所述第一样本数据集得到的语义向量;通过因式分解机FM对所述第一语义隐表示、第二语义隐表示以及第三语义隐表示协同处理后得到所述第三损失函数,所述第二语义隐表示为所述分类模块根据所述第一样本数据集得到的语义向量,所述第三语义隐表示为所述答案抽取模块根据所述第一样本数据集得到的语义向量;根据所述第三损失函数得到所述答案识别模块。7.根据权利要求4所述的模型训练方法,其特征在于,所述训练样本数据集还包括第二样本数据集,所述方法还包括:根据所述第二样本数据集对初始分类模块进行训练以得到所述第一损失函数;
根据所述第一损失函数得到所述分类模块。8.根据权利要求4所述的模型训练方法,其特征在于,所述训练样本数据集还包括第三样本数据集,所述方法还包括:根据所述第三样本数据集对初始分类模块进行训练以得到所述第二损失函数;根据所述第二损失函数得到所述答案提取模块。9.一种问答识别设备,其特征在于,包括:获取单元,用于获取目标问答对,所述目标问答对为目标问题与和与目标问题对应的备选答案组成的问答对;输入单元,用于将所述目标问答对输入目标问答模型,所述目标问答模型的损失函数由分类模块的第一损失函数、答案抽取模块的第二损失函数以及答案识别模块的第三损失函数得到;输出单元,用于输出答案库中是否包括目标问题所对应的目标答案,所述目标...

【专利技术属性】
技术研发人员:胡啸李祺欣邓东车万翔刘挺
申请(专利权)人:哈尔滨工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1