信息处理系统及方法技术方案

技术编号:14771733 阅读:27 留言:0更新日期:2017-03-08 15:12
本发明专利技术提供了一种信息处理系统及方法,一种信息处理方法,包括:将知识库中的知识分组,以获得多个知识集,每个知识集与一知识类别相关联,每个知识集的知识点包括问句和相关联的答案,其中所述问句包括标准问及其扩展问;以及依据账户所需的知识类别为账户指派所述多个知识集中的至少一个知识集,以用于来自该账户的用户问句的问句应答。本发明专利技术使不同的项目可以使用公共的知识库,大大提高了效率。

【技术实现步骤摘要】

本专利技术涉及人机交互
,尤其涉及一种用于智能问答的信息处理系统及方法
技术介绍
人机交互是研究系统与用户之间的交互关系的科学。系统可以是各种各样的机器,也可以是计算机化的系统和软件。例如,通过人机交互可以实现各种人工智能系统,例如,智能客服系统、语音控制系统等等。智能问答系统是人机交互的一种典型应用,其中当用户提出问题后,智能问答系统给出该问题的答案。为此,智能问答系统中有一套知识库,里面有大量的问题和与每个问题相对应的答案。智能问答系统首先需要识别用户所提出的问题,即从知识库中找到与该用户问题所对应的问题,然后找出与该问题相匹配的答案。知识库的配置至关重要。针对不同项目的智能问答系统需要配置不同的知识库,例如针对医疗行业和金融行业两个完全不同的项目需要配置不同的知识库。现有技术中都是采用人工的方式向该项目知识库中添加知识分类,即部署单独环境,在各个环境中分别录入所有所需的知识的方式来实现知识与所属项目的对应,这种人工实现成本高,效率低,最终减慢整个项目的进度。
技术实现思路
以下给出一个或多个方面的简要概述以提供对这些方面的基本理解。此概述不是所有构想到的方面的详尽综览,并且既非旨在指认出所有方面的关键性或决定性要素亦非试图界定任何或所有方面的范围。其唯一的目的是要以简化形式给出一个或多个方面的一些概念以为稍后给出的更加详细的描述之序。本专利技术提供了一种信息处理系统及方法,以解决不同项目知识库录入知识人工实现成本高,效率低的问题。一方面,本专利技术提供了一种信息处理方法,包括:将知识库中的知识分组,以获得多个知识集,每个知识集与一知识类别相关联,每个知识集的知识点包括问句和相关联的答案,其中所述问句包括标准问及其扩展问;以及依据账户所需的知识类别为账户指派所述多个知识集中的至少一个知识集,以用于来自该账户的用户问句的问句应答。另一方面,本专利技术提供了一种信息处理系统,包括:知识库,所述知识库中的知识用于为用户问句提供应答;分组模块,用于将所述知识库中的知识分组,以获得多个知识集,每个知识集与一知识类别相关联,每个知识集的知识点包括问句和相关联的答案,其中所述问句包括标准问及其扩展问;以及指派模块,用于为账户指派所述多个知识集中的至少一个知识集,以用于来自该账户的用户问句的问句应答。与现有技术相比,本专利技术的有益技术效果为:通过将知识分为不同的知识类别的知识集,不同的项目可以使用公共的知识库,只需要按需为之指派知识集即可,大大提高了效率。通过自定义知识集,改善了识别准确率,因为用户自己提供的知识点往往具有较高的准确性和针对性,同时可以不断完善智能问答系统。附图说明在结合以下附图阅读本公开的实施例的详细描述之后,能够更好地理解本专利技术的上述特征和优点。在附图中,各组件不一定是按比例绘制,并且具有类似的相关特性或特征的组件可能具有相同或相近的附图标记。图1是示出了根据本专利技术的一方面的信息处理方法的流程图;图2是示出了根据本专利技术的一方面的智能问答流程的流程图;以及图3是示出了根据本专利技术的一方面的信息处理系统的框图。具体实施方式以下结合附图和具体实施例对本专利技术作详细描述。注意,以下结合附图和具体实施例描述的诸方面仅是示例性的,而不应被理解为对本专利技术的保护范围进行任何限制。知识库中的基本知识点最原始和最简单的形式就是平时常用的FAQ,一般的形式是“问-答”对。在本专利技术中,“标准问”是用来表示某个知识点的文字,主要目标是表达清晰,便于维护。例如,“彩铃的资费”就是表达清晰的标准问描述。这里的“问”不应被狭义地理解为“询问”,而应广义地来理解一“输入”,该“输入”具有对应的“输出”。例如,对于用于控制系统的语义识别而言,用户的一个指令,例如“打开收音机”也应可以被理解为是一个“问”,此时对应的“答”可以是用于执行相应控制的控制程序的调用。用户在向机器输入时,最理想的情况是使用标准问,则机器的智能语义识别系统马上能够理解用户的意思。然而,用户往往并非使用的是标准问,而是标准问的一些变形的形式。例如,若对于收音机的电台切换的标准问形式是“换一个电台”,那么用户可能使用的命令是“切换一个电台”,机器也需要能够识别用户表达的是同一个意思。因此,对于智能语义识别而言,知识库里需要有标准问的扩展问,该扩展问与标准问表达形式有略微差异,但是表达相同的含义。进一步,为了更准确、高效地识别用户问题,智能问答系统还发展出了抽象语义的概念。抽象语义是对本体类属性的进一步抽象。一个类别的抽象语义通过一组抽象语义表达式的集合来描述一类抽象语义的不同表达,为表达更为抽象的语义,这些抽象语义表达式在组成元素上进行了扩充。当这些扩充的元素一旦被赋予了相应的值就可以表达各种各样的具体语义。每一个抽象语义表达式主要可包括缺失语义成分和语义规则词。缺失语义成分由语义成分符表示,当这些缺失的语义成分被填充了相应的值(即内容)后可以表达各式各样的具体语义。抽象语义的语义成分符可包括:[concept]:表示主体或客体成份的词或短语。比如:“彩铃如何开通”中的“彩铃”[action]:表示动作成分的词或短语。比如:“信用卡如何办理”中的“办理”[attribute]:表示属性成份的词或短语。比如:“iphone有哪些颜色”中的“颜色”[adjective]:表示修饰成分的词或短语。比如:“冰箱哪个品牌便宜”中的“便宜”一些主要的抽象语义类别示例有:概念说明[concept]是什么属性构成[concept]有哪些[attribute]行为方式[concept]如何[action]行为地点[concept]在什么地方[action]行为原因[concept]为什么会[action]行为预测[concept]会不会[action]行为判断[concept]有没有[attribute]属性状况[concept]的[attribute]是不是[adjective]属性判断[concept]是不是有[attribute]属性原因[concept]的[attribute]为什么这么[adjective]概念比较[concept1]和[concept2]的区别在哪里属性比较[concept1]和[concept2]的[attribute]有什么不同之处问句在抽象语义层面的成份判断可以通过词性标注来做一般的评判,concept对应的词性为名词,action对应的词性为动词、attribute对应的词性为名词、adjective对应的是形容词。以类别为“行为方式”的抽象语义[concept]如何[action]为例,该类别的抽象语义集合下可包括多条抽象语义表达式:抽象语义类别:行为方式抽象语义表达式:a.[concept][需要|应该?][如何]<才[可以]?><进行?>[action]b.{[concept]~[action]本文档来自技高网...
信息处理系统及方法

【技术保护点】
一种信息处理方法,包括:将知识库中的知识分组,以获得多个知识集,每个知识集与一知识类别相关联,每个知识集的知识点包括问句和相关联的答案,其中所述问句包括标准问及其扩展问;以及依据账户所需的知识类别为账户指派所述多个知识集中的至少一个知识集,以用于来自该账户的用户问句的问句应答。

【技术特征摘要】
1.一种信息处理方法,包括:将知识库中的知识分组,以获得多个知识集,每个知识集与一知识类别相关联,每个知识集的知识点包括问句和相关联的答案,其中所述问句包括标准问及其扩展问;以及依据账户所需的知识类别为账户指派所述多个知识集中的至少一个知识集,以用于来自该账户的用户问句的问句应答。2.如权利要求1所述的信息处理方法,其特征在于,还包括:基于由用户针对一账户提供的知识点制备用于该账户的自定义知识集,以用于来自该账户的用户问句的问句应答。3.如权利要求2所述的信息处理方法,其特征在于,所述基于由用户针对一账户提供的知识点制备用于该账户的自定义知识集包括:为用户提供的每一知识点建立该知识点的标准问。4.如权利要求3所述的信息处理方法,其特征在于,所述基于由用户针对一账户提供的知识点制备用于该账户的自定义知识集还包括:为建立的标准问扩展出若干扩展问。5.如权利要求4所述的信息处理方法,其特征在于,所述扩展问采用以下方式建立:提供抽象语义数据库,所述抽象语义数据库包括多个抽象语义表达式,所述抽象语义表达式包括缺失语义成分;根据所述抽象语义数据库对所述标准问进行抽象语义推荐处理,当获得与所述标准问对应的一个或多个抽象语义表达式时,从所述标准问中提取与一个或多个抽象语义表达式的缺失语义成分对应的内容,并将提取的内容填充到对应的缺失语义成分中以得到与所述标准问对应的一个或多个具体语义表达式,所述具体语义表达式作为所述标准问的扩展问。6.如权利要求5所述的信息处理方法,其特征在于,所述抽象语义推荐处理包括:对所述标准问进行分词处理,得到若干单词,所述单词为语义规则词或非语义规则词;分别对每个非语义规则词进行词性标注处理,得到每个非语义规则词的词性信息;分别对每个语义规则词进行词类判断处理,得到每个语义规则词的词类信息;根据所述词性信息和词类信息对抽象语义数据库进行搜索处理,得到与所述标准问匹配的抽象语义表达式。7.如权利要求6所述的更新方法,其特征在于,所述抽象语义表达式还包括语义规则词,与所述标准问匹配的抽象语义表达式满足以下条件:抽象语义表达式的缺失语义成分对应的词性包括标准问对应的填充内容的词性;抽象语义表达式和标准问中对应的语义规则词相同或属于同一词类;抽象语义表达式的顺序与标准问的表达顺序相同。8.如权利要求1所述的信息处理方法,其特征在于,所述为账户指派所述多个知识集中的至少一个知识集包括:为第一账户指派所述多个知识集中的第一预定数目个知识集;以及为第二账户指派所述多个知识集中的第二预定数目个知识集,所述第一预定数目个知识集与所述第二预定数目个知识集之间具有公共的知识集。9.如权利要求2所述的信息处理方法,其特征在于,还包括:针对来自预定账户的用户问句,当所述预定账户有相关联的自定义知识集时,首先利用所述自定义知识集为所述用户问句执行知识匹配以提供答案;若匹配失败,则利用该用户的所指派知识集为所述用户问句执行知识匹配以提供答案。10.如权利要求9所述的信息处理方法,其特征在于,所述为所述用户问句执行知识匹配包括:将所述用户问句与用于知识匹配的知识集中的问句执行语义相似度计算,语义相似度高于阈值的问句中具有最高语义相似度的问句被确定为匹配问句,所述信息处理方法还包括:将与所述匹配问句相关联的答案提供给用户。11.如权利要求9所述的信息处理方法,其特征在于,还包括:若未找到匹配问句,则提供预设的答案。12.如权利要求1所述的信息处理方法,其特征在于,每个账户与不同的领域的应用相关联,每个账户的用户问句经由与该账户相关联的应用从用户获得,所有的应用共用一个知识库。13....

【专利技术属性】
技术研发人员:华靓朱频频
申请(专利权)人:上海智臻智能网络科技股份有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1