智能问答系统的信息处理方法及装置制造方法及图纸

技术编号:14945307 阅读:91 留言:0更新日期:2017-04-01 11:44
本发明专利技术提供了一种智能问答系统的信息处理方法及装置。一种智能问答系统的信息处理方法,包括:基于用户输入的第一用户问句执行相似度计算以从所述标准问集合确定与所述第一用户问句相匹配的第一标准问;判断所述第一用户问句中是否存在属于全局变量的词语;响应于存在属于全局变量的词语,基于所述第一用户问句中属于全局变量的词语和后续的第二用户问句执行相似度计算以确定与所述第二用户问句相匹配的第二标准问;以及输出与所述第二标准问相关联的答案作为对所述第二用户问句的应答。根据本发明专利技术提高了智能问答系统对用户问句的理解能力,改善了用户体验。

【技术实现步骤摘要】

本专利技术涉及人机交互
,尤其涉及一种用于智能问答系统的信息处理方法及装置
技术介绍
人机交互是研究系统与用户之间的交互关系的科学。系统可以是各种各样的机器,也可以是计算机化的系统和软件。例如,通过人机交互可以实现各种人工智能系统,例如,智能客服系统、语音控制系统等等。人工智能语义识别是人机交互的基础,其能够对人类语言进行识别,以转换成机器能够理解的语言。智能问答系统是人机交互的一种典型应用,其中当用户提出问题后,智能问答系统给出该问题的答案。为此,智能问答系统中有一套知识库,里面有大量的问题和与每个问题相对应的答案。智能问答系统首先需要识别用户所提出的问题,即从知识库中找到与该用户问题所对应的问题,然后找出与该问题相匹配的答案。目前的智能问答系统并没有考虑到上下文的语境,即用户连续提出的问题之间是孤立地来理解的。例如,用户可能先前询问“上外今年在江苏省的招生分数线”,后一句可能问“上外在我们这招多少人”,那么智能问答系统在理解后一句时无法知晓是在哪个省份招收多少人,还需要进一步询问是在哪个省份。这影响了用户体验。
技术实现思路
以下给出一个或多个方面的简要概述以提供对这些方面的基本理解。此概述不是所有构想到的方面的详尽综览,并且既非旨在指认出所有方面的关键性或决定性要素亦非试图界定任何或所有方面的范围。其唯一的目的是要以简化形式给出一个或多个方面的一些概念以为稍后给出的更加详细的描述之序。本专利技术提供了一种智能问答系统的信息处理方法及系统,以解决智能问答系统对用户问句的理解能力较低的问题。一方面,本专利技术提供了一种智能问答系统的信息处理方法,所述智能问答系统包括问答数据库,所述问答数据库包括标准问集合,每个标准问具有对应的答案,所述信息处理方法包括:基于用户输入的第一用户问句执行相似度计算以从所述标准问集合确定与所述第一用户问句相匹配的第一标准问;判断所述第一用户问句中是否存在属于全局变量的词语;响应于存在属于全局变量的词语,基于所述第一用户问句中属于全局变量的词语和后续的第二用户问句执行相似度计算以确定与所述第二用户问句相匹配的第二标准问;以及输出与所述第二标准问相关联的答案作为对所述第二用户问句的应答。另一方面,本专利技术提供了一种智能问答系统的信息处理装置,所述智能问答系统包括问答数据库,所述问答数据库包括标准问集合,每个标准问具有对应的答案,所述信息处理装置包括:匹配模块,用于基于用户输入的第一用户问句执行相似度计算以从所述标准问集合确定与所述第一用户问句相匹配的第一标准问;全局变量判断模块,用于判断所述第一用户问句中是否存在属于全局变量的词语;响应于存在属于全局变量的词语,所述匹配模块基于所述第一用户问句中属于全局变量的词语和后续的第二用户问句执行相似度计算以确定与所述第二用户问句相匹配的第二标准问;以及输出模块,用于输出与所述第二标准问相关联的答案作为对所述第二用户问句的应答。与现有技术相比,本专利技术具有以下有益效果:通过全局变量的引入,智能问答系统充分考虑了上下文的语境来理解用户的问句,提高了对用户问句的理解能力,改善了用户体验。附图说明在结合以下附图阅读本公开的实施例的详细描述之后,能够更好地理解本专利技术的上述特征和优点。在附图中,各组件不一定是按比例绘制,并且具有类似的相关特性或特征的组件可能具有相同或相近的附图标记。图1是示出了根据本专利技术的一方面的用于智能问答系统的信息处理方法的流程图;以及图2是示出了根据本专利技术的一方面的用于智能问答系统的信息处理装置的框图。具体实施方式以下结合附图和具体实施例对本专利技术作详细描述。注意,以下结合附图和具体实施例描述的诸方面仅是示例性的,而不应被理解为对本专利技术的保护范围进行任何限制。知识库中的基本知识点最原始和最简单的形式就是平时常用的FAQ,一般的形式是“问-答”对。在本专利技术中,“标准问”是用来表示某个知识点的文字,主要目标是表达清晰,便于维护。例如,“彩铃的资费”就是表达清晰的标准问描述。这里的“问”不应被狭义地理解为“询问”,而应广义地来理解一“输入”,该“输入”具有对应的“输出”。例如,对于用于控制系统的语义识别而言,用户的一个指令,例如“打开收音机”也应可以被理解为是一个“问”,此时对应的“答”可以是用于执行相应控制的控制程序的调用。用户在向机器输入时,最理想的情况是使用标准问,则机器的智能语义识别系统马上能够理解用户的意思。然而,用户往往并非使用的是标准问,而是标准问的一些变形的形式。例如,若对于收音机的电台切换的标准问形式是“换一个电台”,那么用户可能使用的命令是“切换一个电台”,机器也需要能够识别用户表达的是同一个意思。因此,对于智能语义识别而言,知识库里需要有标准问的扩展问,该扩展问与标准问表达形式有略微差异,但是表达相同的含义。扩展问主要以语义表达式的形式出现。一个标准问可以由若干语义表达式来表征。语义表达式主要由词、词类以及他们的“或”关系构成,其核心依赖于“词类”,词类简单的理解即为一组有共性的词,这些词在语义上可以相似也可以不相似,这些词也可以被标注为重要或不重要。词类是对一组相关词的汇总,词类由词类名和一组相关词所组成。词类名是在这组相关词中具有标签作用的词,即词类的代表。一个词类中至少包含一个词(即词类本身)。语义表达式与用户问句关系与传统的模板匹配有了很大的不同,在传统模板匹配中,模板和用户问句只是匹配与未匹配的关系,而语义表达式与用户问句之间关系是通过量化的值(相似度)来表示,同时这个量化的值与相似问句和用户问句之间的相似度是可以互相比较的。以下说明语义表达式的具体组成和符号的表示。词类的表示([])为区分表达式中的词与词类,规定词类必须出现在方括号“[]”中,方括号中出现的词类一般为“狭义词类”,但是也可通过配置系统参数以支持“广义词类”。下面是一些简单表达式的示例:[飞信][如何][开通][介绍][彩信][业务][飞信]的[登录][方法][来电提醒][如何][收费]或关系的表示(|)在方括号中的词类可以通过“或”关系出现多次,这些“或”关系的词类会在计算相似度的时候以“展开”的方式单独计算。“展开”主要是根据“或”的意义将语义表达式展开成多个简单表达式的过程。如:[彩铃][开通]的[方法|步骤]可展开成“[彩铃][开通]的[步骤]”和“[彩铃][开通]的[方法]”两个简单的语义表达式。这类语义表达式的示例如下:[彩铃][开通]的[方法|步骤][怎样][查询|知道][PUK码][退订|撤销|关闭|停用][IP|17951][国内长途优惠包][来电提醒][功能费|月租费|信息费|通信费]非必要的表示(?)在方括号中的词类可以在结尾加入“?”表示可出现也可以不出现,即非必要的关系,这种非必要关系的词类也同样会在计算相似度的时候以“展开”的方式单独计算。“展开”主要是将语义表达式中含有非必要的词类(或词类的“或组合”)展开成包含和不包含这个词类的两个简单语义表达式的过程。如:[介绍][手机视频][军事栏目][内容][什么?]可展开成“[介绍][手机视频][军事栏目][内容]”和“[介绍][手机视频][军事栏目][内容][什么]”两个简单语义表达式。这类语义表达式的示例如下:[彩铃][取消]的[方法|步骤?][介绍]本文档来自技高网...
智能问答系统的信息处理方法及装置

【技术保护点】
一种智能问答系统的信息处理方法,所述智能问答系统包括问答数据库,所述问答数据库包括标准问集合,每个标准问具有对应的答案,所述信息处理方法包括:基于用户输入的第一用户问句执行相似度计算以从所述标准问集合确定与所述第一用户问句相匹配的第一标准问;判断所述第一用户问句中是否存在属于全局变量的词语;响应于存在属于全局变量的词语,基于所述第一用户问句中属于全局变量的词语和后续的第二用户问句执行相似度计算以确定与所述第二用户问句相匹配的第二标准问;以及输出与所述第二标准问相关联的答案作为对所述第二用户问句的应答。

【技术特征摘要】
1.一种智能问答系统的信息处理方法,所述智能问答系统包括问答数据库,所述问答数据库包括标准问集合,每个标准问具有对应的答案,所述信息处理方法包括:基于用户输入的第一用户问句执行相似度计算以从所述标准问集合确定与所述第一用户问句相匹配的第一标准问;判断所述第一用户问句中是否存在属于全局变量的词语;响应于存在属于全局变量的词语,基于所述第一用户问句中属于全局变量的词语和后续的第二用户问句执行相似度计算以确定与所述第二用户问句相匹配的第二标准问;以及输出与所述第二标准问相关联的答案作为对所述第二用户问句的应答。2.如权利要求1所述的信息处理方法,其特征在于,所述标准问集合中的每个标准问具有用于表征该标准问的至少一个语义表达式,每个语义表达式包括至少一个词类,其中,所述基于用户输入的第一用户问句执行相似度计算包括:将所述第一用户问句与所述问答数据库中的各语义表达式执行语义相似度计算,相似度最高的语义表达式所表征的标准问被确定为与所述第一用户问句相匹配的所述第一标准问,其中所述判断所述第一用户问句中是否存在属于全局变量的词语包括:判断与所述第一用户问句相似度最高的语义表达式中是否含有被标记为全局变量的词类,若有,则所述第一用户问句中与所述全局变量的词类对应的词语为属于全局变量的词语。3.如权利要求2所述的信息处理方法,其特征在于,所述基于所述第一用户问句中属于全局变量的词语与后续的第二用户问句的组合执行相似度计算包括:将所述第二用户问句与所述问答数据库中的各语义表达式执行语义相似度计算,以确定相似度最高的第一语义表达式;将所述第一用户问句中属于全局变量的词语和所述第二用户问句的组合与所述问答数据库中的各语义表达式执行语义相似度计算,以确定相似度最高的第二语义表达式;判断所述第一用户问句中属于全局变量的词语和所述第二用户问句的组合与所述第二语义表达式的相似度是否大于所述第二用户问句与所述第一语义表达式的相似度,若是,则将所述第二语义表达式所表征的标准问确定为与所述第二用户问句相匹配的所述第二标准问。4.如权利要求2所述的信息处理方法,其特征在于,所述基于所述第一用户问句中属于全局变量的词语与后续的第二用户问句的组合执行相似度计算包括:将所述第二用户问句与所述问答数据库中的各语义表达式执行语义相似度计算,以确定相似度最高的第一语义表达式;将所述第一用户问句中属于全局变量的词语和所述第二用户问句的组合与所述问答数据库中的各语义表达式执行语义相似度计算,以确定相似度最高的第二语义表达式;判断所述第一用户问句中属于全局变量的词语和所述第二用户问句的组合与所述第二语义表达式的相似度是否大于所述第二用户问句与所述第一语义表达式的相似度,若否,将所述第一语义表达式所表征的标准问确定为与所述第二用户问句相匹配的所述第二标准问。5.如权利要求3所述的信息处理方法,其特征在于,若所述第一用户问句中属于全局变量的词语和所述第二用户问句的组合与所述第二语义表达式的相似度大于所述第二用户问句与所述第一语义表达式的相似度,判断所述第二语义表达式中与属于全局变量的所述词语相对应的词类是否是被标记为全局变量的词类,若是,则所述第二语义表达式所表征的标准问被确定为与所述第二用户问句相匹配的所述第二标准问。6.如权利要求3所述的信息处理方法,其特征在于,若所述第一用户问句中属于全局变量的词语和所述第二用户问句的组合与所述第二语义表达式的相似度大于所述第二用户问句与所述第一语义表达式的相似度,判断所述第二语义表达式中与属于全局变量的所述词语相对应的词类是否是被标记为全局变量的词类,若否,则所述第一语义表达式所表征的标准问被确定为与所述第二用户问句相匹配的所述第二标准问。...

【专利技术属性】
技术研发人员:曾永梅李波朱频频
申请(专利权)人:上海智臻智能网络科技股份有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1