优化抽象语义库的方法及装置制造方法及图纸

技术编号:13234135 阅读:55 留言:0更新日期:2016-05-14 21:45
本发明专利技术提供了一种基于智能问答系统的正确日志库优化抽象语义库的方法,该正确日志库包括标准问以及与各标准问相关联的相似问,该抽象语义库包括多个类别的抽象语义集合,每个类别的抽象语义集合包括多个抽象语义表达式,该方法包括对该标准问进行抽象语义推荐;对该标准问的相似问进行抽象语义推荐;响应于该标准问的该相似问的抽象语义推荐失败,根据该相似问自动生成对应的抽象语义表达式;将新生成的抽象语义表达式添加至该标准问所被推荐到的抽象语义表达式对应的类别的抽象语义集合中。

【技术实现步骤摘要】

本专利技术涉及人机交互
,尤其涉及基于智能问答系统的正确日志库优化抽象语义库的方法和装置。
技术介绍
人机交互是研究系统与用户之间的交互关系的科学。系统可以是各种各样的机器,也可以是计算机化的系统和软件。例如,通过人机交互可以实现各种人工智能系统,例如,智能客服系统、语音控制系统等等。人工智能语义识别是人机交互的基础,其能够对人类语言进行识别,以转换成机器能够理解的语言。智能问答系统是人机交互的一种典型应用,其中当用户提出问题后,智能问答系统给出该问题的答案。为此,智能问答系统中有一套知识库,里面有大量的问题和与每个问题相对应的答案。智能问答系统首先需要识别用户所提出的问题,即从知识库中找到与该用户问题所对应的问题,然后找出与该问题相匹配的答案。智能问答系统的维护更新是一项重要挑战。
技术实现思路
以下给出一个或多个方面的简要概述以提供对这些方面的基本理解。此概述不是所有构想到的方面的详尽综览,并且既非旨在指认出所有方面的关键性或决定性要素亦非试图界定任何或所有方面的范围。其唯一的目的是要以简化形式给出一个或多个方面的一些概念以为稍后给出的更加详细的描述之序。根据本专利技术的一方面,提供了一种基于智能问答系统的正确日志库优化抽象语义库的方法,该正确日志库包括标准问以及与各标准问相关联的相似问,该抽象语义库包括多个类别的抽象语义集合,每个类别的抽象语义集合包括多个抽象语义表达式,该方法包括:对该标准问进行抽象语义推荐;对该标准问的相似问进行抽象语义推荐;响应于该标准问的该相似问的抽象语义推荐失败,根据该相似问自动生成对应的抽象语义表达式;将新生成的抽象语义表达式添加至该标准问所被推荐到的抽象语义表达式对应的类别的抽象语义集合中。在一实例中,该抽象语义推荐包括:对该标准问和该标准问的相似问进行分词处理,分别得到若干单词,该单词为语义规则词或非语义规则词;对每个非语义规则词进行词性标注处理,得到每个非语义规则词的词性信息;对每个语义规则词进行词类判断处理,得到每个语义规则词的词类信息;根据该词性信息和词类信息对抽象语义库进行搜索处理,得到与该标准问及其相似问分别相匹配的抽象语义表达式。在一实例中,该抽象语义表达式包括缺失语义成分和语义规则词,与该标准问匹配的抽象语义表达式满足以下条件:抽象语义表达式的缺失语义成分对应的词性包括标准问中对应内容的词性;抽象语义表达式和标准问中对应的语义规则词相同或属于同一词类;抽象语义表达式的顺序与标准问的表达顺序相同,以及与该相似问匹配的抽象语义表达式满足以下条件:抽象语义表达式的缺失语义成分对应的词性包括相似问中对应内容的词性;抽象语义表达式和相似问中对应的语义规则词相同或属于同一词类;抽象语义表达式的顺序与相似问的表达顺序相同。在一实例中,该根据该相似问自动生成对应的抽象语义表达式包括:对该相似问进行分词以获得若干单词,每个单词为语义规则词或非语义规则词;对每个非语义规则词进行词性标注,得到每个非语义规则词的词性信息;以及至少基于每个非语义规则词的词性信息将每个非语义规则词替换为相应语义成分符以作为新生成抽象语义规则的缺失语义成分。在一实例中,该至少基于每个非语义规则词的词性信息将每个非语义规则词替换为相应语义成分符还包括:基于该相似问的上下文将每个非语义规则词替换为相应语义成分符以作为新生成抽象语义规则的缺失语义成分。在一实例中,该新生成的抽象语义表达式在经人工确认正确后被添加至该标准问所对应的类别的抽象语义集合中。在一实例中,该方法还包括响应于所述标准问的该相似问的抽象语义推荐成功但与所述标准问对应不同类别的抽象语义集合,对该相似问所被推荐到的抽象语义表达式进行人工确认。在一实例中,该方法还包括:对该标准问推荐到的抽象语义表达式对应的类别进行人工确认。根据本专利技术的另一方面,提供了一种基于智能问答系统的正确日志库优化抽象语义库的装置,该正确日志库包括标准问以及与各标准问相关联的相似问,该抽象语义库包括多个类别的抽象语义集合,每个类别的抽象语义集合包括多个抽象语义表达式,该装置包括:抽象语义推荐模块,用于对该标准问进行抽象语义推荐,以及对该标准问的相似问进行抽象语义推荐;抽象语义表达式生成模块,用于响应于该标准问的该相似问的抽象语义推荐失败,根据该相似问自动生成对应的抽象语义表达式;以及抽象语义库编辑模块,用于将新生成的抽象语义表达式添加至该标准问所被推荐到的抽象语义表达式对应的类别的抽象语义集合中。在一实例中,该抽象语义推模块包括:分词模块,对该标准问和该标准问的相似问进行分词处理,分别得到若干单词,该单词为语义规则词或非语义规则词;词性标注模块,用于对每个非语义规则词进行词性标注处理,得到每个非语义规则词的词性信息;词类判断模块,用于对每个语义规则词进行词类判断处理,得到每个语义规则词的词类信息;搜索模块,用于根据该词性信息和词类信息对抽象语义库进行搜索处理,得到与该标准问及其相似问分别相匹配的抽象语义表达式。在一实例中,该抽象语义表达式包括缺失语义成分和语义规则词,与该标准问匹配的抽象语义表达式满足以下条件:抽象语义表达式的缺失语义成分对应的词性包括标准问中对应内容的词性;抽象语义表达式和标准问中对应的语义规则词相同或属于同一词类;抽象语义表达式的顺序与标准问的表达顺序相同,以及与该相似问匹配的抽象语义表达式满足以下条件:抽象语义表达式的缺失语义成分对应的词性包括相似问中对应内容的词性;抽象语义表达式和相似问中对应的语义规则词相同或属于同一词类;抽象语义表达式的顺序与相似问的表达顺序相同。在一实例中,该抽象语义表达式生成模块包括:分词模块,用于对该相似问进行分词以获得若干单词,每个单词为语义规则词或非语义规则词;词性标注模块,用于对每个非语义规则词进行词性标注,得到每个非语义规则词的词性信息;以及填充模块,用于至少基于每个非语义规则词的词性信息将每个非语义规则词替换为相应语义成分符以作为新生成抽象语义规则的缺失语义成分。在一实例中,该填充模块进一步用于基于该相似问的上下文将每个非语义规则词替换为相应语义成分符以作为新生成抽象语义规则的缺失语义成分。在一实例中,该根据该相似问自动生成的抽象语义表达式在经人工确认正确后被添加至该标准问所对应的类别的抽象语义集合中。根据本专利技术的方案,对标准问的所有相似问进行类似的处理,只要一相似问没有定位到某一抽象语义类别,就生成该相似问的抽象语义表达式并添加到相应的抽象语义类别中,以完善优化该抽象语义类别。通过对正确日志库中的所有标准问进行相同的处理,以优化整个抽象语义库,从而可以加快知识运维效率,降低知识运维的人工成本。【附图说明】在结合以下附图阅读本公开的实施例的详细描述之后,能够更好地理解本专利技术的上述特征和优点。在附图中,各组件不一定是按比例绘制,并且具有类似的相关特性或特征的组件可能具有相同或相近的附图标记。图1是示出了基于智能问答系统的正确日志库优化抽象语义库的方法的流程图;图2是示出了根据本专利技术的一方面的用于生成抽象语义表达式的方法的流程图;以及图3是示出了基于智能问答系统的正确日志库优化抽象语义库的装置的框图。【具体实施方式】以下结合附图和具体实施例对本专利技术作详细描述。注意,以下结合附图和具体实施例本文档来自技高网...

【技术保护点】
一种基于智能问答系统的正确日志库优化抽象语义库的方法,所述正确日志库包括标准问以及与各标准问相关联的相似问,所述抽象语义库包括多个类别的抽象语义集合,每个类别的抽象语义集合包括多个抽象语义表达式,所述方法包括:对所述标准问进行抽象语义推荐;对所述标准问的相似问进行抽象语义推荐;响应于所述标准问的该相似问的抽象语义推荐失败,根据该相似问自动生成对应的抽象语义表达式;将新生成的抽象语义表达式添加至所述标准问所被推荐到的抽象语义表达式对应的类别的抽象语义集合中。

【技术特征摘要】

【专利技术属性】
技术研发人员:曾永梅朱频频
申请(专利权)人:上海智臻智能网络科技股份有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1