一种基于知识图谱的人机对话的方法及装置制造方法及图纸

技术编号:14146013 阅读:141 留言:0更新日期:2016-12-11 02:14
本发明专利技术公开了一种基于知识图谱的人机对话的方法及装置,该方法包括以下步骤:S1:接收用户发送的语句,并获取该语句的上文语句类别;S2:确定该语句最终所属类别;S3:通过知识图谱抽取该语句中的特征词,并判断所有特征词是否有关联;S4:根据聊天对话库对该语句进行对话匹配;S5:对该语句进行正则模式匹配;S6:根据语句的类别进行分析处理并生成回复。本发明专利技术在一定程度上控制语句的类别,并且使常识的知识问答和定制的开放领域问答同一在一个流程中,有别于现存的自动问答系统中只依靠聊天库和分类模型的进行问题答案的搜索,并且在发明专利技术中加入了模板匹配和知识图谱搜索的技术,能够使得人机对话更加的丰富。

【技术实现步骤摘要】

本专利技术属于人机问答的数据处理,尤其涉及一种基于知识图谱的人机对话的方法及装置
技术介绍
智能问答系统以一问一答形式,精确的定位网站用户所需要的提问知识,通过与网站用户进行交互,为网站用户提供个性化的信息服务。智能问答系统是将积累的无序语料信息,进行有序和科学的整理,并建立基于知识的分类模型;这些分类模型可以指导新增加的语料咨询和服务信息,节约人力资源,提高信息处理的自动性,降低网站运行成本。基于对网站多年积累的关于政府和企业的基本情况常见问题及其解答,整理为规范的问答库形式,以支撑各种形式问题的智能问答。方便了用户,提高了办事效率,提升了企业形象。现在智能问答系统通常会借助于自然语言处理和全文搜索技术对语句进行处理,单一的方式通常在某一些的准确率会比较低。以往的智能问答系统只会针对于某一个领域的问答,对于开放域的问答系统,现在还没有一种通用的,而且扩展性比较好的处理流程的出现。问答系统主要包括句子分类,信息检索,答案抽取,语义理解,知识图谱等方面的技术。
技术实现思路
为了克服现有技术的不足,本专利技术的目的之一在于提供一种基于知识图谱的人机对话的方法,其能对常识和开放领域的问题进行回答。本专利技术的目的之二在于提供一种基于知识图谱的人机对话的装置,其能对常识和开放领域的问题进行回答。本专利技术的目的之一采用以下技术方案实现:一种基于知识图谱的人机对话的方法,包括以下步骤:S1:接收用户发送的语句,并获取该语句的上文语句,并确定该语句和上文语句的类别;S2:根据该语句的类别和上文语句的类别来确定该语句的最终所属类别;S3:通过知识图谱抽取该语句中的特征词,并判断所有特征词是否有关联,如果有,则根据特征词的关联生成回复,如果没有,则执行步骤S4;S4:根据聊天对话库对该语句进行对话匹配,如果匹配成功,则生成回复,如果失败,则执行步骤S5;S5:对该语句进行正则模式匹配,如果匹配成功,则生成相应的回复,如果匹配失败,则执行步骤S6;S6:根据该语句的最终所属类别进行分析处理并生成回复。优选地,步骤S2具体包括以下子步骤:S21:根据该语句的类别和上文语句的类别来确定所述语句的类别等级和上文语句的类别等级;S22:判断所述语句的类别等级是否大于上文语句的类别等级,如果是,则选用所述语句的类别作为该语句的最终所属类别,如果否,则选用上文语句的类别作为该语句的最终所属类别。能够进一步公开步骤S2的实现方式。优选地,步骤S4具体包括以下子步骤:S41:根据聊天对话库对该语句进行全文搜索;S42:通过Jaccard Similarity算法计算聊天对话库中候选语句与输入语句的相似度;S43:判断所得相似度是否大于一阈值,如果大于该阈值,则选择相应语句进行回复,如果小于该阈值,则执行步骤S5。其能进一步公开步骤S4的具体实现方式。优选地,所述阈值为0.7。其能进一步公开阈值数值的设置。优选地,步骤S6具体包括以下子步骤:S61:根据该语句的最终所属类别抽取与该语句的最终所属类别相关的属性特征;S62:根据所得属性特征的抽取程序,抽取与属性特征对应的属性;S63:根据所得属性生成回复。其能进一步公开步骤S6的实现方式。本专利技术的目的之二采用以下技术方案实现:一种基于知识图谱的人机对话的装置,包括以下模块:接收模块:用于接收用户发送的语句,并获取该语句的上文语句,并确定该语句和上文语句的类别;分类模块:用于根据该语句的类别和上文语句的类别来确定该语句的最终所属类别;知识图谱模块:用于通过知识图谱抽取该语句中的特征词,并判断所有特征词是否有关联,如果有,则根据特征词的关联生成回复,如果没有,则执行聊天匹配模块;聊天匹配模块:用于根据聊天对话库对该语句进行对话匹配,如果匹配成功,则生成回复,如果失败,则执行正则匹配模块;正则匹配模块:用于对该语句进行正则模式匹配,如果匹配成功,则生成相应的回复,如果匹配失败,则执行分析处理模块;分析处理模块:用于根据该语句的最终所属类别进行分析处理并生成回复。优选地,分类模块具体包括以下子模块:等级确定模块:根据该语句的类别和上文语句的类别来确定所述语句的类别等级和上文语句的类别等级;第一判断模块:判断所述语句的类别等级是否大于上文语句的类别等级,如果是,则选用所述语句的类别作为该语句的最终所属类别,如果否,则选用上文语句的类别作为该语句的最终所属类别。能够进一步确定分类模块所包含的具体子模块。优选地,聊天匹配模块具体包括以下子模块:全文搜索模块:用于根据聊天对话库对该语句进行全文搜索;计算模块:用于通过Jaccard Similarity算法计算聊天对话库中候选语句与输入语句的相似度;第二判断模块:用于判断所得相似度是否大于一阈值,如果大于该阈值,则选择相应语句进行回复,如果小于该阈值,则执行正则匹配模块。其能进一步公开聊天匹配模块所包含的具体模块。优选地,所述阈值为0.7。其能进一步公开阈值的数值。优选地,分析处理模块具体包括以下子模块:属性抽取模块:用于根据该语句的最终所属类别抽取与该语句的最终所属类别相关的属性特征;属性匹配模块:用于根据所得属性特征的抽取程序,抽取与属性特征对应的属性;回复模块:用于根据所得属性生成回复。其能进一步公开分析处理模块所包含的子模块。相比现有技术,本专利技术的有益效果在于:本专利技术在一定程度上控制语句的类别,并且使常识的知识问答和定制的开放领域问答同一在一个流程中,有别于现存的自动问答系统中只依靠聊天库和分类模型的进行问题答案的搜索,并且在专利技术中加入了模板匹配和知识图谱搜索的技术,能够使得人机对话更加的丰富。附图说明图1为本专利技术一种基于知识图谱的人机对话的方法的流程图;图2为本专利技术一种基于知识图谱的人机对话的装置的结构框图;图3为本专利技术的语句分类的分类表。具体实施方式下面,结合附图以及具体实施方式,对本专利技术做进一步描述:如图1所示,本专利技术提供了一种基于知识图谱的人机对话的方法,包括以下步骤:S1:接收用户发送的语句,并获取该语句的上文语句,并确定该语句和上文语句的类别;S2:根据该语句的类别和上文语句的类别来确定该语句的最终所属类别;步骤S2具体包括以下子步骤:S21:根据该语句的类别和上文语句的类别来确定所述语句的类别等级和上文语句的类别等级;S22:判断所述语句的类别等级是否大于上文语句的类别等级,如果是,则选用所述语句的类别作为该语句的最终所属类别,如果否,则选用上文语句的类别作为该语句的最终所属类别。在此步骤是为了确定在后续步骤中对该语句以哪种分类来继续进行处理,分类结果的确定需要通过对上下文中的当前分类来比对,然后才确定选用那种分类,比对的方式主要采用而类别的等级比较,以高等级的类别优先,如图3所示,1级为最低等级,46级为最高级别,从1级到46级等级依次上升,例如,用户说“我要导航”的时候,这一句子无疑是“导航”分类的,但是,导航需要有一个目的地,所以,后端会生成“请问您的目的地是哪”以询问用户的目的地,当客户回应是,例如用户说“广州”,“广州”这个短语进入分类时,它可能会被分类为“什么”这个类别,而如果一旦客户回复的短语被分类至其他类别时,导航这个目的就无法完成了,所以需要类别优先级做修正。由于“导航”这个分类在用户的会话中未被关闭,所以当“广州本文档来自技高网...
一种基于知识图谱的人机对话的方法及装置

【技术保护点】
一种基于知识图谱的人机对话的方法,其特征在于,包括以下步骤:S1:接收用户发送的语句,获取该语句的上文语句,并确定该语句和上文语句的类别;S2:根据该语句的类别和上文语句的类别来确定该语句的最终所属类别;S3:通过知识图谱抽取该语句中的特征词,并判断所有特征词是否有关联,如果有,则根据特征词的关联生成回复,如果没有,则执行步骤S4;S4:根据聊天对话库对该语句进行对话匹配,如果匹配成功,则生成回复,如果失败,则执行步骤S5;S5:对该语句进行正则模式匹配,如果匹配成功,则生成相应的回复,如果匹配失败,则执行步骤S6;S6:根据该语句的最终所属类别进行分析处理并生成回复。

【技术特征摘要】
1.一种基于知识图谱的人机对话的方法,其特征在于,包括以下步骤:S1:接收用户发送的语句,获取该语句的上文语句,并确定该语句和上文语句的类别;S2:根据该语句的类别和上文语句的类别来确定该语句的最终所属类别;S3:通过知识图谱抽取该语句中的特征词,并判断所有特征词是否有关联,如果有,则根据特征词的关联生成回复,如果没有,则执行步骤S4;S4:根据聊天对话库对该语句进行对话匹配,如果匹配成功,则生成回复,如果失败,则执行步骤S5;S5:对该语句进行正则模式匹配,如果匹配成功,则生成相应的回复,如果匹配失败,则执行步骤S6;S6:根据该语句的最终所属类别进行分析处理并生成回复。2.如权利要求1所述的基于知识图谱的人机对话的方法,其特征在于,步骤S2具体包括以下子步骤:S21:根据该语句的类别和上文语句的类别来确定所述语句的类别等级和上文语句的类别等级;S22:判断所述语句的类别等级是否大于上文语句的类别等级,如果是,则选用所述语句的类别作为该语句的最终所属类别,如果否,则选用上文语句的类别作为该语句的最终所属类别。3.如权利要求1所述的基于知识图谱的人机对话的方法,其特征在于,步骤S4具体包括以下子步骤:S41:根据聊天对话库对该语句进行全文搜索;S42:通过Jaccard Similarity算法计算聊天对话库中候选语句与输入语句的相似度;S43:判断所得相似度是否大于一阈值,如果大于该阈值,则选择相应语句进行回复,如果小于该阈值,则执行步骤S5。4.如权利要求3所述的基于知识图谱的人机对话的方法,其特征在于,所述阈值为0.7。5.如权利要求1所述的基于知识图谱的人机对话的方法,其特征在于,步骤S6具体包括以下子步骤:S61:根据该语句的最终所属类别抽取与该语句的最终所属类别相关的属性特征;S62:根据所得属性特征的抽取程序,抽取与属性特征对应的属性;S63:根据所得属性生成回复。6.一种基于知识图谱的人机对话的装置,其特征在于,包括以下模块:接收模块:用于...

【专利技术属性】
技术研发人员:黄明新
申请(专利权)人:广州安望信息科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1