一种任务式回答的确定方法、装置、电子设备及存储介质制造方法及图纸

技术编号:37262827 阅读:21 留言:0更新日期:2023-04-20 23:36
本申请提供了一种任务式回答的确定方法、装置、电子设备及存储介质,确定方法包括:基于原始问句对应的业务范围,对原始问句进行分词,确定出多个关键词,并确定出每个关键词的属性信息;基于每个关键词在原始问句中的位置顺序对每个关键词的属性信息进行排序,生成原始问句的属性信息序列;根据属性信息序列从句子模板字典树的根节点开始,依次寻找出属性信息序列中的每个属性信息相匹配的目标节点,将多个目标节点进行路径连接,确定出属性信息序列相对应的目标句子模板;基于目标句子模板以及多个关键词,确定出原始问句的答案。提升了句子模板的匹配效率,进而提高了任务式回答确定的效率和准确率。定的效率和准确率。定的效率和准确率。

【技术实现步骤摘要】
一种任务式回答的确定方法、装置、电子设备及存储介质


[0001]本申请涉及人机交互智能问答
,尤其是涉及一种任务式回答的确定方法、装置、电子设备及存储介质。

技术介绍

[0002]目前,随着互联网在各行业的深入应用,以及人工智能技术的迅速发展,人们对智能对话类产品的接受度越来越高,各种问答系统、对话机器人也变得越来越常见。其中任务式问答系统不但可以提升客户的服务体验,还可以大大减少人工客服的成本,已经被越来越多的企业/公司所选择。不同于闲聊式的对话系统,任务式问答系统将对话内容限制到一个较小的业务范围内,因此能简洁准确地回答用户的问题,并真实有效地完成用户需要的业务操作。
[0003]传统上,任务式问答系统一般分为四个部分:NLU(自然语言理解),DST(对话状态跟踪),DP(对话策略)和NLG(自然语言生成)。NLU是理解用户的问题,包括意图识别和槽位填充。DST是根据历史信息和当前NLU结果得到当前的对话状态,DP是根据当前对话状态决定当前的对话动作(包括引导式询问,澄清意图,查询知识库等),DLG则是将对话动作映射为用户可理解的自然语言。四个模块中,最重要也是难度最大的就是NLU模块。这个模块目前业界一般是使用句子模板来解决。目前句子模板的方法有两个问题:一是模板内容较死板,概括能力不强,往往导致需要大量的模板。二是当系统较复杂,模板数目会过于巨大,此时简单的遍历匹配效率极低。所以,如何针对句子模板存在的问题提高任务式问答确定过程的效率和准确率成为了不容小觑的技术问题。

技术实现思路
/>[0004]有鉴于此,本申请的目的在于提供一种任务式回答的确定方法、装置、电子设备及存储介质,通过多个关键词的属性信息,生成属性信息序列,利用属性信息序列在句子模板字典树中进行节点查找,进而快速准确地匹配出问句对应的句子模板,提升句子模板的匹配效率,提高了任务式回答确定的效率和准确率。
[0005]本申请实施例提供了一种任务式回答的确定方法,所述确定方法:获取用户的原始问句;基于所述原始问句对应的业务范围,对所述原始问句进行分词,确定出多个关键词,并确定出每个所述关键词的属性信息;基于每个所述关键词在所述原始问句中的位置顺序对每个所述关键词的属性信息进行排序,生成所述原始问句的属性信息序列;根据所述属性信息序列从句子模板字典树的根节点开始,依次寻找出所述属性信息序列中的每个所述属性信息相匹配的目标节点,将多个目标节点进行路径连接,确定出所述属性信息序列相对应的目标句子模板;其中,所述目标节点的字符信息为所述关键词的属性信息;
基于所述目标句子模板以及多个所述关键词,确定出所述原始问句的答案。
[0006]在一种可能的实施方式中,所述基于所述原始问句对应的业务范围,对所述原始问句进行分词,确定出多个关键词,包括:根据所述原始问句对应的业务范围对所述原始问句进行分词,确定出多个参考关键词;检测在多个所述参考关键词之中是否出现了具备相同表征含义的参考关键词;若是,则将具备相同表征含义的参考关键词整合为一个关键词。
[0007]在一种可能的实施方式中,通过以下步骤确定出所述句子模板字典树:获取多个样本句子模板,其中,组建所述样本句子模板的结构信息为关键词的属性信息、普通字符串以及通配符中的任意一种;针对于每个所述样本句子模板,从根节点开始依据该样本句子模板的第一结构信息构建第一节点的字符信息,依据该样本句子模板中的第二结构信息构建第二节点的字符信息,直至完成对该样本句子模板的最后结构信息对应的节点的字符信息的构建时,在最后结构信息相对应的节点之后建立一个结束节点,完成对该样本句子模板的节点路径的建立;根据多个所述样本句子模板的节点路径,确定出所述句子模板字典树。
[0008]在一种可能的实施方式中,所述基于每个所述关键词在所述原始问句中的位置顺序对每个所述关键词的属性信息进行排序,生成所述原始问句的属性信息序列,包括:在对多个所述关键词的属性信息进行排序之后,检测在多个所述关键词的属性信息之中,是否存在连续的同类型的所述属性信息;若是,则将连续的同类型所述属性信息进行合并,生成所述原始问句的属性信息序列。
[0009]在一种可能的实施方式中,所述根据所述属性信息序列从句子模板字典树的根节点开始,依次寻找出所述属性信息序列中的每个所述属性信息相匹配的目标节点,将多个目标节点进行路径连接,确定出所述属性信息序列相对应的目标句子模板,包括:从根节点开始,在多个第一节点中确定出所述属性信息序列中的第一属性信息相匹配的至少一个目标第一节点,在确定出的所述目标第一节点下的第二节点中筛选出与所述属性信息序列中的第二属性信息相匹配的至少一个目标第二节点;直至所述属性信息序列中的最后一个属性信息与相对应的目标第三节点匹配完成后,检测所述目标第三节点的下一节点是否为结束节点;若是,则由所述目标第一节点、所述目标第二节点以及所述目标第三节点所构成的句子模板为所述属性信息序列相对应的目标句子模板;若否,则需重新筛选出所述属性信息序列相对应的目标句子模板。
[0010]在一种可能的实施方式中,在所述对所述原始问句进行分词,确定出多个关键词过程中,所述确定方法还包括:根据预设字符规范化标准对所述原始问句的字符格式进行规范化调整;其中,所述预设字符规范化标准包括全角半角的统一以及不存在空白格。
[0011]本申请实施例还提供了一种任务式回答的确定装置,所述确定装置包括:获取模块,用于获取用户的原始问句;
分词模块,用于基于所述原始问句对应的业务范围,对所述原始问句进行分词,确定出多个关键词,并确定出每个所述关键词的属性信息;序列生成模块,用于基于每个所述关键词在所述原始问句中的位置顺序对每个所述关键词的属性信息进行排序,生成所述原始问句的属性信息序列;查找模块,用于根据所述属性信息序列从句子模板字典树的根节点开始,依次寻找出所述属性信息序列中的每个所述属性信息相匹配的目标节点,将多个目标节点进行路径连接,确定出所述属性信息序列相对应的目标句子模板;其中,所述目标节点的字符信息为所述关键词的属性信息;答案确定模块,用于基于所述目标句子模板以及多个所述关键词,确定出所述原始问句的答案。
[0012]在一种可能的实施方式中,所述分词模块在用于所述基于所述原始问句对应的业务范围,对所述原始问句进行分词,确定出多个关键词时,所述分词模块具体用于:根据所述原始问句对应的业务范围对所述原始问句进行分词,确定出多个参考关键词;检测在多个所述参考关键词之中是否出现了具备相同表征含义的参考关键词;若是,则将具备相同表征含义的参考关键词整合为一个关键词。
[0013]本申请实施例还提供一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如上述的任务式回答的确定方法的步骤。
[0014]本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种任务式回答的确定方法,其特征在于,所述确定方法包括:获取用户的原始问句;基于所述原始问句对应的业务范围,对所述原始问句进行分词,确定出多个关键词,并确定出每个所述关键词的属性信息;基于每个所述关键词在所述原始问句中的位置顺序对每个所述关键词的属性信息进行排序,生成所述原始问句的属性信息序列;根据所述属性信息序列从句子模板字典树的根节点开始,依次寻找出所述属性信息序列中的每个所述属性信息相匹配的目标节点,将多个目标节点进行路径连接,确定出所述属性信息序列相对应的目标句子模板;其中,所述目标节点的字符信息为所述关键词的属性信息;基于所述目标句子模板以及多个所述关键词,确定出所述原始问句的答案。2.根据权利要求1所述的确定方法,其特征在于,所述基于所述原始问句对应的业务范围,对所述原始问句进行分词,确定出多个关键词,包括:根据所述原始问句对应的业务范围对所述原始问句进行分词,确定出多个参考关键词;检测在多个所述参考关键词之中是否出现了具备相同表征含义的参考关键词;若是,则将具备相同表征含义的参考关键词整合为一个关键词。3.根据权利要求1所述的确定方法,其特征在于,通过以下步骤确定出所述句子模板字典树:获取多个样本句子模板,其中,组建所述样本句子模板的结构信息为关键词的属性信息、普通字符串以及通配符中的任意一种;针对于每个所述样本句子模板,从根节点开始依据该样本句子模板的第一结构信息构建第一节点的字符信息,依据该样本句子模板中的第二结构信息构建第二节点的字符信息,直至完成对该样本句子模板的最后结构信息对应的节点的字符信息的构建时,在最后结构信息相对应的节点之后建立一个结束节点,完成对该样本句子模板的节点路径的建立;根据多个所述样本句子模板的节点路径,确定出所述句子模板字典树。4.根据权利要求1所述的确定方法,其特征在于,所述基于每个所述关键词在所述原始问句中的位置顺序对每个所述关键词的属性信息进行排序,生成所述原始问句的属性信息序列,包括:在对多个所述关键词的属性信息进行排序之后,检测在多个所述关键词的属性信息之中,是否存在连续的同类型的所述属性信息;若是,则将连续的同类型所述属性信息进行合并,生成所述原始问句的属性信息序列。5.根据权利要求1所述的确定方法,其特征在于,所述根据所述属性信息序列从句子模板字典树的根节点开始,依次寻找出所述属性信息序列中的每个所述属性信息相匹配的目标节点,将多个目标节点进行路径连接,确定出所述属性信息序列相对应的目标句子模板,包括:从根节点开始,在多个第一节点中确定出所述属性信息序列中的第一属性信息相匹配的至少...

【专利技术属性】
技术研发人员:李衡峰王秋明
申请(专利权)人:北京远鉴信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1