一种基于知识图谱的人机对话的方法及装置制造方法及图纸

技术编号：14146013 阅读：141 留言：0更新日期：2016-12-11 02:14

本发明专利技术公开了一种基于知识图谱的人机对话的方法及装置，该方法包括以下步骤：S1：接收用户发送的语句，并获取该语句的上文语句类别；S2：确定该语句最终所属类别；S3：通过知识图谱抽取该语句中的特征词，并判断所有特征词是否有关联；S4：根据聊天对话库对该语句进行对话匹配；S5：对该语句进行正则模式匹配；S6：根据语句的类别进行分析处理并生成回复。本发明专利技术在一定程度上控制语句的类别，并且使常识的知识问答和定制的开放领域问答同一在一个流程中，有别于现存的自动问答系统中只依靠聊天库和分类模型的进行问题答案的搜索，并且在发明专利技术中加入了模板匹配和知识图谱搜索的技术，能够使得人机对话更加的丰富。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于人机问答的数据处理，尤其涉及一种基于知识图谱的人机对话的方法及装置。
技术介绍
智能问答系统以一问一答形式，精确的定位网站用户所需要的提问知识，通过与网站用户进行交互，为网站用户提供个性化的信息服务。智能问答系统是将积累的无序语料信息，进行有序和科学的整理，并建立基于知识的分类模型；这些分类模型可以指导新增加的语料咨询和服务信息，节约人力资源，提高信息处理的自动性，降低网站运行成本。基于对网站多年积累的关于政府和企业的基本情况常见问题及其解答，整理为规范的问答库形式，以支撑各种形式问题的智能问答。方便了用户，提高了办事效率，提升了企业形象。现在智能问答系统通常会借助于自然语言处理和全文搜索技术对语句进行处理，单一的方式通常在某一些的准确率会比较低。以往的智能问答系统只会针对于某一个领域的问答，对于开放域的问答系统，现在还没有一种通用的，而且扩展性比较好的处理流程的出现。问答系统主要包括句子分类，信息检索，答案抽取，语义理解，知识图谱等方面的技术。
技术实现思路
为了克服现有技术的不足，本专利技术的目的之一在于提供一种基于知识图谱的人机对话的方法，其能对常识和开放领域的问题进行回答。本专利技术的目的之二在于提供一种基于知识图谱的人机对话的装置，其能对常识和开放领域的问题进行回答。本专利技术的目的之一采用以下技术方案实现：一种基于知识图谱的人机对话的方法，包括以下步骤：S1：接收用户发送的语句，并获取该语句的上文语句，并确定该语句和上文语句的类别；S2：根据该语句的类别和上文语句的类别来确定该语句的最终所属类别；S3：通过知识图谱抽取该语句中的特征...
一种基于知识图谱的人机对话的方法及装置

【技术保护点】
一种基于知识图谱的人机对话的方法，其特征在于，包括以下步骤：S1：接收用户发送的语句，获取该语句的上文语句，并确定该语句和上文语句的类别；S2：根据该语句的类别和上文语句的类别来确定该语句的最终所属类别；S3：通过知识图谱抽取该语句中的特征词，并判断所有特征词是否有关联，如果有，则根据特征词的关联生成回复，如果没有，则执行步骤S4；S4：根据聊天对话库对该语句进行对话匹配，如果匹配成功，则生成回复，如果失败，则执行步骤S5；S5：对该语句进行正则模式匹配，如果匹配成功，则生成相应的回复，如果匹配失败，则执行步骤S6；S6：根据该语句的最终所属类别进行分析处理并生成回复。

【技术特征摘要】
1.一种基于知识图谱的人机对话的方法，其特征在于，包括以下步骤：S1：接收用户发送的语句，获取该语句的上文语句，并确定该语句和上文语句的类别；S2：根据该语句的类别和上文语句的类别来确定该语句的最终所属类别；S3：通过知识图谱抽取该语句中的特征词，并判断所有特征词是否有关联，如果有，则根据特征词的关联生成回复，如果没有，则执行步骤S4；S4：根据聊天对话库对该语句进行对话匹配，如果匹配成功，则生成回复，如果失败，则执行步骤S5；S5：对该语句进行正则模式匹配，如果匹配成功，则生成相应的回复，如果匹配失败，则执行步骤S6；S6：根据该语句的最终所属类别进行分析处理并生成回复。2.如权利要求1所述的基于知识图谱的人机对话的方法，其特征在于，步骤S2具体包括以下子步骤：S21：根据该语句的类别和上文语句的类别来确定所述语句的类别等级和上文语句的类别等级；S22：判断所述语句的类别等级是否大于上文语句的类别等级，如果是，则选用所述语句的类别作为该语句的最终所属类别，如果否，则选用上文语句的类别作为该语句的最终所属类别。3.如权利要求1所述的基于知识图谱的人机对话的方法，其特征在于，步骤S4具体包括以下子步骤：S41：根据聊天对话库对该语句进行全文搜索；S42：通过Jaccard Similarity算法计算聊天对话库中候选语句与输入语句的相似度；S43：判断所得相似度是否大于一阈值，如果大于该阈值，则选择相应语句进行回复，如果小于该阈值，则执行步骤S5。4.如权利要求3所述的基于知识图谱的人机对话的方法，其特征在于，所述阈值为0.7。5.如权利要求1所述的基于知识图谱的人机对话的方法，其特征在于，步骤S6具体包括以下子步骤：S61：根据该语句的最终所属类别抽取与该语句的最终所属类别相关的属性特征；S62：根据所得属性特征的抽取程序，抽取与属性特征对应的属性；S63：根据所得属性生成回复。6.一种基于知识图谱的人机对话的装置，其特征在于，包括以下模块：接收模块：用于...

【专利技术属性】
技术研发人员：黄明新，
申请(专利权)人：广州安望信息科技有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人