基于知识图谱的问答机器人的回复生成策略方法及系统技术方案

技术编号:38246232 阅读:6 留言:0更新日期:2023-07-25 18:06
本发明专利技术公开了一种基于知识图谱的问答机器人的回复生成策略方法及系统,涉及智能机器人技术领域。该方法包括:获取并根据问答领域和对应的业务场景特征设计多种问句主题类型和多种意图类型,对用户问句进行分析识别,确定用户意图;根据多种问句主题类型和多种意图类型设计不同类型问题的问答机器人,并进行会话策略规则学习,针对不同类型的问答机器人设定不同答句生成引擎,生成对应的答句;根据多个不同类型的机器人生成的答句进行语义融合、冲突处理和答案排序与评估,返回最终回复答案给用户。本发明专利技术可对复杂问句进行精准理解,针对性解决各种业务需求,及时准确且全面的响应用户需求;并进行答案评估与排序,提供更为优质的回复。质的回复。质的回复。

【技术实现步骤摘要】
基于知识图谱的问答机器人的回复生成策略方法及系统


[0001]本专利技术涉及智能机器人
,具体而言,涉及一种基于知识图谱的问答机器人的回复生成策略方法及系统。

技术介绍

[0002]智能问答机器人是一种基于自然语言处理技术的智能人机交互系统,可以根据用户提出的自然语言问句进行语义理解、知识检索并将答案以自然语言形式返回给用户。随着人工智能技术的不断发展和深度学习算法的普及,智能问答机器人的技术也得到了大幅度的提升,其适用的业务场景也越来越广泛。此外,领域知识图谱以其强大的开放互联和语义表示能力为智能咨询、智能导诊等智能化服务提供知识支撑,在智慧医疗、智慧金融等业务领域中发挥基础性作用。此外,随着智能语音助手的发展,智能问答机器人还可以与语音助手相结合,实现更加智能化的服务。
[0003]虽然基于知识图谱的智能问答机器人已取得了显著的进展和广泛应用,但由于用户问句表达多样性和业务场景复杂性,面向垂直领域的问答机器人可用性仍然较差,问答效果受到多种因素的影响。现有问答机器人的问题解析能力仍然较差,尤其是在解析时带入ASR识别结果错误导致预制对话流程无法正常进行。问题经过解析后,单一流程控制的问答机器人通过各类检索、推理分析手段得到的答案可能存在语法、逻辑、语义等方面的错误,导致生成的答案语义稀疏、质量参差不齐等复杂情况。此时问答机器人在考虑了上述情况下,采取何种策略对回复答案进行排序和生成,即如何生成最优回复答案尤为重要。

技术实现思路

[0004]为了克服上述问题或者至少部分地解决上述问题,本专利技术提供一种基于知识图谱的问答机器人的回复生成策略方法及系统,可对复杂问句进行精准理解,针对性解决各种业务需求,及时准确且全面的响应用户需求;并进行答案评估与排序,提供更为优质的回复。
[0005]为解决上述技术问题,本专利技术采用的技术方案为:第一方面,本专利技术提供一种基于知识图谱的问答机器人的回复生成策略方法,包括以下步骤:获取并根据问答领域和对应的业务场景特征设计多种问句主题类型和多种意图类型,对用户问句进行语义信息分析、主题分类以及主题意图识别,以确定用户意图;根据多种问句主题类型和多种意图类型设计不同类型问题的问答机器人,并基于预置的问答训练集,结合问句中关键实体在主题知识图谱上的推理路径进行会话策略规则学习,并针对不同类型的问答机器人设定不同答句生成引擎,结合用户意图生成对应的答句;根据多个不同类型的机器人生成的答句进行语义融合、冲突处理和答案排序与评估,以输出并返回最终回复答案给用户。
[0006]本专利技术提供了面向特定领域的复杂问句深度理解方法,实现针对用户复杂问句的语义分析、主题识别及用户意图理解,面向复杂结构问句实现结构分解和类型划分,突破了现有技术问题解析能力限制,精准理解用户在不同业务场景下用户多方面需求;本专利技术还提供了基于策略学习的多引擎答句生成方法,通过策略学习算法生成面向多种用户意图、多类型用户问句的最优会话策略,设计多种面向不同业务需求的问答机器人,基于多种答句生成引擎针对性解决各种业务需求,解决了现有技术单一控制流程下对用户意图响应不准确、不全面的问题;在此基础上,本专利技术还提供了面向信息融合的答案排序与组织方法,通过对多个自然语言答句进行语义融合、冲突消解和答案评估,实现多个答案之间信息互补与交叉验证,为用户提供完整的答句,全面覆盖用户所有业务需求,并根据答案质量和重要程度进行评估和排序。
[0007]基于第一方面,进一步地,上述对用户问句进行语义信息分析、主题分类以及主题意图识别方法包括以下步骤:对用户问句进行识别,识别用户问句中包含的实体,并进行依存句法分析得到核心依存树;根据实体数量进行问句类型划分,划分为无实体问句、单实体问句或多实体问句;针对多实体问句进行语义结构分类,对主从类、并列类、关系类多种问句结构进行拆解,得到问句序列;基于BERT

CNN算法对问句序列分别进行主题与意图识别。
[0008]基于第一方面,进一步地,上述结合用户意图生成对应的答句的方法包括以下步骤:输入问句序列、实体列表、依存树列表、问句主题及用户意图,基于关键实体和主题意图在主题知识图谱上进行实体链接、相关路径检索、子图匹配,以确定会话策略规则;基于会话策略规则选择最优问答机器人子集;输出问答机器人回答子句集合。
[0009]基于第一方面,进一步地,上述基于预置的问答训练集,结合问句中关键实体在主题知识图谱上的推理路径进行会话策略规则学习的方法包括以下步骤:输入问答训练集中所有问答对,针对问句进行实体分析和主题提取;针对相关实体,在主题知识图谱上进行实体链接和相关路径查询;通过预置的评价算法评价并根据各个引擎对每种类别的问题检索答案的满意度,初步确定策略中各个引擎的调用顺序;为已确定调用顺序的引擎设置一个阈值,并利用随后调用的引擎的阈值不断提高调用的序列中第一个引擎的阈值,最后为第一个引擎确定一个最终阈值;保存问答机器人策略学习后得到的会话策略,构建会话策略库。
[0010]基于第一方面,进一步地,该基于知识图谱的问答机器人的回复生成策略方法还包括以下步骤:A1、根据问题的预期类别以及通过会话策略规则学习得到的会话策略,为输入的查询问题选择对应的问答机器人策略;A2、按照问答机器人策略中确定的顺序依次调用每个问答机器人引擎;A3、通过问答机器人策略中调用的第一个引擎检索答案;
A4、判断当前检索到的答句是否符合条件,若符合,则终止,选择当前引擎;若不符合,则进入步骤A5;A5、调用第二个引擎,合并第一个引擎和第二个引擎检索得到的答案,形成新的答案列表,进行步骤A4,直至检索出的答案列表中排名第一的答案的置信度超过第一个引擎的阈值,或者策略中再没有可调用的其它引擎。
[0011]基于第一方面,进一步地,上述根据多个不同类型的机器人生成的答句进行语义融合、冲突处理和答案排序与评估,以输出并返回最终回复答案给用户的方法包括以下步骤:B1、输入多个不同类型的机器人生成的答句列表,计算答句列表中各个答案子句间的相似度;B2、基于各个答案子句间的相似度和预设的相似度阈值判断答案子句中是否包含重复信息,若不包含,则将所有答案子句拼接,进入步骤B4;若包含,则进入步骤B3;B3、对对应重复的答案子句进行语义融合,实现答案去重;B4、检测所有答案子句是否存在同一实体同一属性信息的情况,若存在,则进入步骤B5;反之,则进入步骤B6;B5、基于预定义的冲突消解规则对对应的答案子句进行冲突处理;B6、对进行答案去重和冲突处理后的所有答案子句进行答句质量评估,生成答句质量评估结果;B7、根据答句质量评估结果,对所有答案子句进行排序和重新组织,以输出并返回最终回复答案给用户。
[0012]第二方面,本专利技术提供一种基于知识图谱的问答机器人的回复生成策略系统,包括问句语义分析模块、机器人会话策略生成模块以及答句排序与组织生成模块,其中:问句语义分析模块,用于获取并根据问答领域和对应的业务场景特征设计多种问句主题类型和多种意图类型,对用户问句进行语义信息分析、主题分类以本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于知识图谱的问答机器人的回复生成策略方法,其特征在于,包括以下步骤:获取并根据问答领域和对应的业务场景特征设计多种问句主题类型和多种意图类型,对用户问句进行语义信息分析、主题分类以及主题意图识别,以确定用户意图;根据多种问句主题类型和多种意图类型设计不同类型问题的问答机器人,并基于预置的问答训练集,结合问句中关键实体在主题知识图谱上的推理路径进行会话策略规则学习,并针对不同类型的问答机器人设定不同答句生成引擎,结合用户意图生成对应的答句;根据多个不同类型的机器人生成的答句进行语义融合、冲突处理和答案排序与评估,以输出并返回最终回复答案给用户。2.根据权利要求1所述的一种基于知识图谱的问答机器人的回复生成策略方法,其特征在于,所述对用户问句进行语义信息分析、主题分类以及主题意图识别方法包括以下步骤:对用户问句进行识别,识别用户问句中包含的实体,并进行依存句法分析得到核心依存树;根据实体数量进行问句类型划分,划分为无实体问句、单实体问句或多实体问句;针对多实体问句进行语义结构分类,对主从类、并列类、关系类多种问句结构进行拆解,得到问句序列;基于BERT

CNN算法对问句序列分别进行主题与意图识别。3.根据权利要求2所述的一种基于知识图谱的问答机器人的回复生成策略方法,其特征在于,所述结合用户意图生成对应的答句的方法包括以下步骤:输入问句序列、实体列表、依存树列表、问句主题及用户意图,基于关键实体和主题意图在主题知识图谱上进行实体链接、相关路径检索、子图匹配,以确定会话策略规则;基于会话策略规则选择最优问答机器人子集;输出问答机器人回答子句集合。4.根据权利要求1所述的一种基于知识图谱的问答机器人的回复生成策略方法,其特征在于,所述基于预置的问答训练集,结合问句中关键实体在主题知识图谱上的推理路径进行会话策略规则学习的方法包括以下步骤:输入问答训练集中所有问答对,针对问句进行实体分析和主题提取;针对相关实体,在主题知识图谱上进行实体链接和相关路径查询;通过预置的评价算法评价并根据各个引擎对每种类别的问题检索答案的满意度,初步确定策略中各个引擎的调用顺序;为已确定调用顺序的引擎设置一个阈值,并利用随后调用的引擎的阈值不断提高调用的序列中第一个引擎的阈值,最后为第一个引擎确定一个最终阈值;保存问答机器人策略学习后得到的会话策略,构建会话策略库。5.根据权利要求4所述的一种基于知识图谱的问答机器人的回复生成策略方法,其特征在于,还包括以下步骤:A1、根据问题的预期类别以及通过会话策略规则学习得到的会话策略,为输入的查询问题选择对应的问答机器人策略;A2、按照问答机器人策略中确定的顺序依次调用每个问答机...

【专利技术属性】
技术研发人员:李靖阳
申请(专利权)人:北京海纳数聚科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1