System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及自然语言处理领域,尤其涉及一种问答知识库的优化方法及其装置。
技术介绍
1、目前,多通过挖掘一个知识点下与标准问题句同义但不同词的相似问题句来扩充问答知识库,标准问题句与其同义但不同词的相似问题句对应同一个知识点,通过挖掘相似问题句使得常见问题解答(frequently-asked questions,简称faq)系统在基于问答知识库对用户提出的问题句进行应答时,能够通过将用户提出的问题句和各个知识点下的问题句(如标准问题及与标准问题同义但不同词的相似问题)进行相似度匹配,来准确匹配到用户提出的问题句对应的知识点,从而使得fqa不受同义词的影响。而混淆问题句是指用户提出的问题句与知识库中多个知识点下的问题句都比较相似,此时基于当前的问答知识库将难以正确匹配到对应的知识点,使得基于问答知识库的应答准确率较低。
技术实现思路
1、本申请旨在至少在一定程度上解决相关技术中的技术问题之一。
2、为此,本申请的第一个目的在于提出一种问答知识库的优化方法。
3、本申请的第二个目的在于提出一种问答知识库的优化装置。
4、本申请的第三个目的在于提出一种电子设备。
5、本申请的第四个目的在于提出一种非瞬时计算机可读存储介质。
6、本申请的第五个目的在于提出一种计算机程序产品。
7、为达上述目的,本申请第一方面实施例提出了一种问答知识库的优化方法,包括:确定问答知识库,所述问答知识库中包括知识点和知识点对应的问题集;从所
8、本申请从问答知识库包括的问题集中选取目标问题句,并根据问题集,获取目标问题句对应的目标混淆问题句;确定目标混淆问题句对应的关联知识点,并将目标混淆问题句归属到关联知识点对应的问题集中。通过挖掘各个知识点的混淆问题句,并将混淆问题句归属到对应的关联知识点下,来扩充问答知识库,增强问答知识库对用户可能提出的问题句的涵盖范围,在基于该问答知识库实现常用问题解答或检索功能时,能够正确匹配到用户提出的问题句对应的知识点,增强应答效果。
9、为达上述目的,本申请第二方面实施例提出了一种问答知识库的优化装置,包括:第一确定模块,用于确定问答知识库,所述问答知识库中包括知识点和知识点对应的问题集;获取模块,用于从所述问答知识库包括的问题集中选取目标问题句,并根据所述问题集,获取所述目标问题句对应的目标混淆问题句;第二确定所述目标混淆问题句对应的关联知识点,并将所述目标混淆问题句归属到所述关联知识点对应的问题集中。
10、本申请从问答知识库包括的问题集中选取目标问题句,并根据问题集,获取目标问题句对应的目标混淆问题句;确定目标混淆问题句对应的关联知识点,并将目标混淆问题句归属到关联知识点对应的问题集中。通过挖掘各个知识点的混淆问题句,并将混淆问题句归属到对应的关联知识点下,来扩充问答知识库,增强问答知识库对用户可能提出的问题句的涵盖范围,在基于该问答知识库实现常用问题解答或检索功能时,能够正确匹配到用户提出的问题句对应的知识点,增强应答效果。
11、为达上述目的,本申请第三方面实施例提出了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以实现如本申请第一方面实施例所述的问答知识库的优化方法。
12、为达上述目的,本申请第四方面实施例提出了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于实现如本申请第一方面实施例所述的问答知识库的优化方法。
13、为达上述目的,本申请第五方面实施例提出了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时用于实现如本申请第一方面实施例所述的问答知识库的优化方法。
本文档来自技高网...【技术保护点】
1.一种问答知识库的优化方法,其特征在于,包括:
2.根据权利要求1所述的优化方法,其特征在于,所述根据所述问题集,获取所述目标问题句对应的目标混淆问题句,包括:
3.根据权利要求2所述的优化方法,其特征在于,所述根据所述目标问题句和所述相似问题句集合,获取所述目标混淆问题句之前,还包括:
4.根据权利要求2或3所述的优化方法,其特征在于,所述根据所述目标问题句和所述相似问题句集合,获取所述目标混淆问题句,包括:
5.根据权利要求4所述的优化方法,其特征在于,所述基于所述问题句对中两个问题句各自的分词序列,获取所述问题句对对应的公共分词序列,包括:
6.根据权利要求4所述的优化方法,其特征在于,所述根据公共分词序列生成所述目标混淆问题句,包括:
7.根据权利要求6所述的优化方法,其特征在于,所述基于所述公共分词序列得到所述目标问题句的候选混淆问题句,包括:
8.根据权利要求7所述的优化方法,其特征在于,所述对所述公共分词序列进行编辑之前,还包括:
9.根据权利要求8所述的优化方法,其特
10.根据权利要求7所述的优化方法,其特征在于,所述判断所述公共分词序列对应的语句是否合法,包括:
11.根据权利要求7所述的优化方法,其特征在于,所述判断所述公共分词序列对应的语句是否合法,包括:
12.根据权利要求7所述的优化方法,其特征在于,所述对所述公共分词序列进行编辑,生成新的所述公共分词序列,包括:
13.根据权利要求6所述的优化方法,其特征在于,所述确定所述候选混淆问题句的混淆度得分,包括:
14.一种问答知识库的优化装置,其特征在于,包括:
15.根据权利要求14所述的优化装置,其特征在于,所述获取模块,进一步用于:
16.根据权利要求15所述的优化装置,其特征在于,所述获取模块,还用于:
17.根据权利要求15或16所述的优化装置,其特征在于,所述获取模块,进一步用于:
18.根据权利要求17所述的优化装置,其特征在于,所述获取模块,进一步用于:
19.一种电子设备,包括:
20.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-13中任一项所述的方法。
21.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-13中任一项所述的方法。
...【技术特征摘要】
1.一种问答知识库的优化方法,其特征在于,包括:
2.根据权利要求1所述的优化方法,其特征在于,所述根据所述问题集,获取所述目标问题句对应的目标混淆问题句,包括:
3.根据权利要求2所述的优化方法,其特征在于,所述根据所述目标问题句和所述相似问题句集合,获取所述目标混淆问题句之前,还包括:
4.根据权利要求2或3所述的优化方法,其特征在于,所述根据所述目标问题句和所述相似问题句集合,获取所述目标混淆问题句,包括:
5.根据权利要求4所述的优化方法,其特征在于,所述基于所述问题句对中两个问题句各自的分词序列,获取所述问题句对对应的公共分词序列,包括:
6.根据权利要求4所述的优化方法,其特征在于,所述根据公共分词序列生成所述目标混淆问题句,包括:
7.根据权利要求6所述的优化方法,其特征在于,所述基于所述公共分词序列得到所述目标问题句的候选混淆问题句,包括:
8.根据权利要求7所述的优化方法,其特征在于,所述对所述公共分词序列进行编辑之前,还包括:
9.根据权利要求8所述的优化方法,其特征在于,所述预设条件为所述公共分词序列的总编辑次数大于预设次数,或者公共分词序列的分词个数小于预设分词数。
10.根据权利要求7所述的优化方法,其...
【专利技术属性】
技术研发人员:李鹏,徐超,熊超,包勇军,颜伟鹏,
申请(专利权)人:北京沃东天骏信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。