计算机可读存储介质及问答交互方法技术

技术编号:19511336 阅读:18 留言:0更新日期:2018-11-21 07:48
一种计算机可读存储介质及问答交互方法,所述方法包括:对知识库中目标问答交互事务中的每个问句进行分词;对所述目标问答交互事务中的每个问句通过依存分析提取核心词;将所述知识库中每个所述目标问答交互事务的每个问句的核心词保存,得到所述知识库的目标问句事务集;获取与知识库中每个所述目标问句事务集的核心词强关联规则对应的关联问句序列。使用上述的方案提供的关联问句序列可以提高问答系统的正确率和召回率。

【技术实现步骤摘要】
计算机可读存储介质及问答交互方法本申请是申请日为2015年10月30日,申请号为201510727236.X,专利技术创造名称为“用于问答系统挖掘关联问句的方法及装置”的分案申请。
本专利技术涉及智能交互领域,尤其涉及一种计算机可读存储介质及问答交互方法。
技术介绍
关联规则挖掘(Associationrulemining)是数据挖掘中最活跃的研究方法之一,可以用来发现事情之间的联系,最早是为了发现超市交易数据库中不同的商品之间的关系。目前,在以自然语言为基础的问答交互系统中,也应用到了关联规则的挖掘,以期获取问句间的关联关系,进而使用获取的问句间关联关系计算问答系统返回给用户的答案。准确率和召回率是评价自动问答系统的技术指标。准确率是指问答系统做出正确应答的次数占总共应答次数的比率,召回率是指问答系统做出正确应答的次数占知识库中存在正确应答数目的比率。通过现有技术的方法获得的关联规则,在用于问答系统中计算返回给用户的答案时,返回答案的准确率较低,换言之,问答系统的准确率和召回率较低。
技术实现思路
本专利技术解决的技术问题是提供一种计算机可读存储介质及问答交互方法,使得问答系统的正确率和召回率得到提高。为解决上述技术问题,本专利技术实施例提供一种计算机可读存储介质,其上存储有程序,该程序被执行时实现问答系统挖掘关联问句的方法,所述方法包括:对知识库中目标问答交互事务中的每个问句进行分词;对所述目标问答交互事务中的每个问句通过依存分析提取核心词;将所述知识库中每个所述目标问答交互事务的每个问句的核心词保存,得到所述知识库的目标问句事务集;获取与知识库中每个所述目标问句事务集的核心词强关联规则对应的关联问句序列,并得出符合所述问句序列意图的答案。可选的,还包括:在对所述问句通过依存分析提取核心词前,过滤所述每个问句中的无用信息。可选的,所述对所述目标问答交互事务中的每个问句通过依存分析提取核心词,包括:通过依存分析获取所述问句中的各个词语之间的依存关系,利用依存关系找到所述问句的主语和宾语;当所述主语为名词时,将所述主语作为核心词;否则,将所述宾语作为核心词。可选的,所述将所述知识库中每个所述目标问答交互事务的每个问句的核心词保存,包括:当对每个所述目标问答交互事务中的问句依次提取核心词时若连续出现相同的核心词,仅保留最后一次出现的核心词。可选的,所述判断处理所述获取与知识库中每个所述目标问句事务集的核心词强关联规则对应的关联问句序列,包括:根据每个所述目标问答交互事务中的核心词,通过Apriori或FP-Tree方法获取所述问句事务集中的核心词强关联规则,根据所述核心词强关联规则获取对应的关联问句序列。可选的,还包括:在对每个问句进行分词之前,统计所述知识库中每一个问答交互事务的问答对数目,将所述问答对数目处于特定范围的事务作为所述目标问答交互事务。为解决上述技术问题,本专利技术实施例还提供一种问答交互方法,包括:对知识库中目标问答交互事务中的每个问句进行分词;对所述目标问答交互事务中的每个问句通过依存分析提取核心词;将所述知识库中每个目标问答交互事务的每个问句的核心词保存,得到所述知识库的目标问句事务集;获取与知识库中每个所述目标问句事务集的核心词强关联规则对应的关联问句序列;可选的,还包括:在对所述问句通过依存分析提取核心词前,过滤所述每个问句中的无用信息。可选的,所述对所述目标问答交互事务中的每个问句通过依存分析提取核心词包括:依存分析获取所述有效问句中的各个词语之间的依存关系,利用依存关系找到所述有效问句的主语和宾语;当所述主语为名词时,将所述主语作为核心词;否则,将所述宾语作为核心词。可选的,还包括:在对每个问句进行分词之前,统计所述知识库中每一个问答交互事务的问答对数目,将所述问答对数目处于特定范围的事务作为所述目标问答交互事务。与现有技术相比,本专利技术实施例的技术方案具有以下有益效果:本专利技术实施例的技术方案通过对知识库中目标问答交互事务中的每个问句进行分词,对所述目标问答交互事务中的每个问句通过依存分析提取核心词,将所述知识库中每个所述目标问答交互事务的每个问句的核心词保存,得到所述知识库的目标问句事务集,获取与知识库中每个所述目标问句事务集的核心词强关联规则对应的关联问句序列。由于本技术方案采用依存分析这种能够对语句更深层次的词语之间的修饰关系进行分析的方法来提取用户问句序列的核心词,使得基于核心词得到的关联规则更能有效地用于问答系统计算返回用户的答案,提高了问答系统理解用户意图的能力,从而提高了问答系统的准确率和召回率。进一步地,本专利技术实施例的技术方案通过在问句提取核心词前,过滤每个分词后的问句中的无用信息,从而减少挖掘关联问句的运算量,提升计算效率。进一步地,通过统计问句事务中的问答对的数目后,仅对处于特定范围的事务中的问句进行关联问句序列挖掘,从而忽略可能存在无效交互的问答事务,提高挖掘关联规则的效率。附图说明图1是本专利技术实施例中的一种用于问答系统挖掘关联问句的方法的流程示意图;图2是本专利技术实施例中的一种用于问答系统挖掘关联问句的方法的流程示意图;图3是本专利技术实施例中的一种用于问答系统挖掘关联问句的装置的结构图;图4是本专利技术实施例中的一种用于问答系统挖掘关联问句的装置的结构示意图。具体实施方式如
技术介绍
所言,通过现有技术的方法获得的关联规则,在用于问答系统中计算返回给用户的答案时,返回答案的准确率较低,这使得问答系统的准确率和召回率较低。本申请的专利技术人通过研究发现,现有技术对用户输入问句的核心词的提取大多通过统计特征,如词频、词性、词语出现的位置关系以及一些人工设定的语法规则来确定,这些方法提取出的核心词经关联规则挖掘得到的关联问句序列,在参与问答系统的返回答案计算后返回答案的准确率较低,进而影响问答系统的准确率和召回率。本专利技术实施例的技术方案通过对知识库中目标问答交互事务中的每个问句进行分词,对所述目标问答交互事务中的每个问句通过依存分析提取核心词,将所述知识库中每个所述目标问答交互事务的每个问句的核心词保存,得到所述知识库的目标问句事务集,获取与知识库中每个所述目标问句事务集的核心词强关联规则对应的关联问句序列。由于本技术方案采用依存分析这种能够对语句更深层次的词语之间的修饰关系进行分析的方法,来提取用户问句序列的核心词,使得基于核心词得到的关联规则更能有效地用于问答系统计算返回给用户的答案,提高了问答系统理解用户意图的能力,从而提高了问答系统的准确率和召回率。为使本专利技术的上述目的、特征和优点能够更为明显易懂,下面结合附图对本专利技术的具体实施例做详细的说明。图1为本专利技术实施例中的一种用于问答系统挖掘关联问句的方法的流程示意图。所述用于问答系统挖掘关联问句的方法包括如下步骤:步骤S101:对知识库中目标问答交互事务中的每个问句进行分词;步骤S102:对所述目标问答交互事务中的每个问句通过依存分析提取核心词;步骤S103:将所述知识库中每个所述目标问答交互事务的每个问句的核心词保存,得到所述知识库的目标问句事务集;步骤S104:获取与知识库中每个所述目标问句事务集的核心词强关联规则对应的关联问句序列。本专利技术实施例通过采用依存分析这种能够对语句更深层次的词语之间的修饰关系进行分析的方法来提取用户本文档来自技高网
...

【技术保护点】
1.一种计算机可读存储介质,其上存储有程序,其特征在于,该程序被执行时实现问答系统挖掘关联问句的方法,所述方法包括:对知识库中目标问答交互事务中的每个问句进行分词;对所述目标问答交互事务中的每个问句通过依存分析提取核心词;将所述知识库中每个所述目标问答交互事务的每个问句的核心词保存,得到所述知识库的目标问句事务集;获取与知识库中每个所述目标问句事务集的核心词强关联规则对应的关联问句序列。

【技术特征摘要】
1.一种计算机可读存储介质,其上存储有程序,其特征在于,该程序被执行时实现问答系统挖掘关联问句的方法,所述方法包括:对知识库中目标问答交互事务中的每个问句进行分词;对所述目标问答交互事务中的每个问句通过依存分析提取核心词;将所述知识库中每个所述目标问答交互事务的每个问句的核心词保存,得到所述知识库的目标问句事务集;获取与知识库中每个所述目标问句事务集的核心词强关联规则对应的关联问句序列。2.根据权利要求1所述的计算机可读存储介质,其特征在于,所述方法还包括:在对所述问句通过依存分析提取核心词前,过滤所述每个问句中的无用信息。3.根据权利要求2所述的计算机可读存储介质,其特征在于,所述对所述目标问答交互事务中的每个问句通过依存分析提取核心词,包括:通过依存分析获取所述问句中的各个词语之间的依存关系,利用依存关系找到所述问句的主语和宾语;当所述主语为名词时,将所述主语作为核心词;否则,将所述宾语作为核心词。4.根据权利要求1所述的计算机可读存储介质,其特征在于,所述将所述知识库中每个所述目标问答交互事务的每个问句的核心词保存,包括:当对每个所述目标问答交互事务中的问句依次提取核心词时若连续出现相同的核心词,仅保留最后一次出现的核心词。5.根据权利要求1所述的计算机可读存储介质,其特征在于,所述判断处理所述获取与知识库中每个所述目标问句事务集的核心词强关联规则对应的关联问句序列,包括:根据每个所述目标问答交互事务中的核心词,通过Apriori或FP-T...

【专利技术属性】
技术研发人员:朱频频
申请(专利权)人:上海智臻智能网络科技股份有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1