一种基于知识图谱的人机交互方法及系统技术方案

技术编号:27935620 阅读:22 留言:0更新日期:2021-04-02 14:15
本发明专利技术公开了一种基于知识图谱的人机交互的方法及系统,所述方法包括:对样本知识进行分类,构建分领域知识数据的聚类;对聚类后的知识数据,采用TransE算法将分类领域库中的知识以三元组的形式,构建有向知识图谱;通过将串行的处理方式改成网络并行处理,同时提取主题分类和融合历史会话信息,借助知识图谱中的概率知识,筛选用户真实意图进行判断,从而提高了人机交互信息的查询效率。

【技术实现步骤摘要】
一种基于知识图谱的人机交互方法及系统
本专利技术涉及人工智能领域,具体适用于基于知识图谱的人机交互方法和系统。
技术介绍
近年来,随着人工智能技术的发展,知识图谱这一技术与生活中的应用越来越近了。在各个领域都有所应用,比如机器人的人工对话,智能客户电话的机器问答等。知识图谱作为一种语义网络,可以用来表现复杂演化的实体语义关系。知识图谱拥有极强的表达能力和建模灵活性:首先,知识图谱是一种语义表示,可以对现实世界中的实体、概念、属性以及它们之间的关系进行建模;其次,知识图谱是其衍生技术的数据交换标准,其本身是一种数据建模的“协议”,相关技术涵盖知识抽取、知识集成、知识管理和知识应用等各个环节。知识图谱之中涉及到了数据存储和处理模块两部分。现有的人机相互系统,大部分都集中在知识图谱的存储、查询和更新在内的数据管理模块,如何管理一个可更新的超大规模稀疏三阶张量。通常是将知识图谱数据的主语、谓词和宾语三个部分分别看作三个维度,每一个维度上的取值范围即知识图谱中对应位置出现的所有值,那么整个数据集就可以被一个稀疏的三阶张量表示,进而将知识图谱的存储问题也可以转换为对这个三阶张量的压缩和索引。这个三阶张量非常稀疏且分布不均匀,其中主语和宾语这两维的数量大,可以达到十亿量级,而谓词通常在几千到上万的量级。目前而言,快速,高效,且准确地在基于如此巨大的知识图谱中辅助找到适合的信息成为研究的热点,同时如何与现有的适合知识图谱构造的应用场景如法院审判系统和合同智能审核等相结合,从而提高处理效率等也受到广泛关注。r>
技术实现思路
为解决上述技术问题至少之一,本专利技术提出一种人机交互的方法及系统,将串行的处理方式改成网络并行处理,同时提取主题分类和融合历史会话信息,借助知识图谱中的概率知识,筛选用户真实意图进行判断,从而提高了人机交互信息的反馈的高效和快捷。所述方法包括:步骤S01,对训练样本知识进行分类,构建分领域知识数据的聚类;步骤S02,对聚类后的知识数据,采用TransE算法将分类领域库中的知识以三元组的形式,构建有向知识图谱;步骤S03,解析获得的会话信息,获取其中的话题分类,依据该话题分类与知识分类的聚类信息的匹配度,获得对应的知识图谱,依据该知识图谱,响应于该会话信息进行输出。进一步,所述聚类,采用k-means聚类,首先使用映射操作并行地将原始知识数据转换为可聚类的格式,给不同服务器分配互不重复的知识数据,每个服务器根据给定的k值随机选取k个知识数据作为初始聚类中心,并对其按照顺序编号,对知识数据进行初始划分,得到k个聚类作为初始聚类中心后,对每个知识数据执行划分和下述迭代操作:每个服务器在映射阶段分别读出位于本地的知识数据,并计算每个知识数据到各初始聚类中心的距离,将其归属到最近的初始聚类中心,该步骤操作是并行进行的,再将本次聚类结果在缩减过程中返回;缩减过程是得到所有知识数据的聚类结果,并对各服务器聚类结果进行合并后,在每个新的聚类中选取权值最大的知识数据作为新的聚类中心;重复执行上述映射和缩减操作,直到聚类中心不再变化或达到最大迭代次数时,结束迭代,并输出每个知识数据归属的聚类信息。进一步,所述话题分类中包括主话题和子话题,所述知识图谱中的数据包含主话题和子话题之间的关联度。进一步,在人机交互会话时时,可以采用神经网络算法结合知识图谱进行输出。进一步,所述神经网络算法是RNN算法或LSTM算法。进一步,所述人机会话时,依据当前会话和历史会话信息的相关程度,决定是否在神经网络算法中引入历史参考信息。进一步,所述人机会话时的主题提取,依据当前会话和历史会话信息进行分类,提取。进一步,所述人机会话时,在会话意图主题不明确时,依据知识图谱的信息进行补充确认。还提供一种基于知识图谱的人机交互系统,所述系统包括人机交互装置,所述人机交互装置包括处理器和存储器,所述存储器上存储有计算机程序,所述处理器处理上述计算机程序以执行方法。还提供一种计算机存储介质,所述计算机存储介质上,存储有计算机程序,所述计算机程序被处理器执行,以实现方法。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是知识图谱的功能架构示意图;图2是本申请方法的流程示意图;图3是人机交互装置的示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。实施例1如图1所示知识图谱的一种功能架构逻辑示意图,知识图谱作为一种语义网络,可以用来表现复杂演化的实体语义关系。知识图谱拥有极强的表达能力和建模灵活性:将多个词组的语义结果结合知识图谱,分析多个词组的内在关系和/或逻辑关系,生成文字信息的语义理解结果。首先,知识图谱作为一种带标记的有向属性图,其中每个结点都有若干个属性和属性值,实体与实体之间的边表示的是结点之间的关系,边的指向方向表示了关系的方向,而边上的标记表示了关系的类型。其次,知识图谱是一种人类可识别且对机器友好的知识表示。知识图谱采用了人类容易识别的字符串来标识各元素;同时,图数据表示作为一种通用的数据结构,可以很容易地被计算机识别和处理。再次,知识图谱自带语义,蕴涵逻辑含义和规则。知识图谱中的结点对应现实世界中的实体或者概念,每条边或属性也对应现实中的一条知识。在所述知识图谱数据库中,每一个话题都是所述知识图谱里的一个或几个实体,所述知识图谱数据库包含话题与话题之间的相关度和联系。在此之上,我们可以根据定义的规则,推导出知识图谱数据中没有明确给出的知识。从而给予查询或交互的用户以回应。所述的知识图谱表示框架和查询语言:资源描述框架(ResourceDescriptionFramework,RDF)和SPARQL查询语言(SPARQLProtocolandQueryLanguage,SPARQL)。其将资源描述框架中的基本元素格式为:<主,谓,宾>或<s,p,o>。它采用主语、谓词和宾语的方式来表示和陈述一条知识,这种表示方式简单且灵活。由于资源描述框架的英文缩写为RDF,知识图谱数据集也经常被称为RDF数据集,而其管理工具通常被称为RDFStore或TripleStore。RDF数据可以分为两个部分:显式三元组和隐含三元组。规则可作用于显式三元组,也可用于推导隐含的三元组。所述的隐含语义信息处理基于规则的推理将增加存储、查询代价。处理方法分为两类:在在查询时,按照将推理规则将一个查询重写成多个查询,将多个词组的语义结果结合知识图本文档来自技高网...

【技术保护点】
1.一种基于知识图谱的人机交互方法,其特征在于:所述方法包括:/n步骤S01,对样本知识进行分类,构建分领域知识数据的聚类;/n步骤S02,对聚类后的知识数据,采用TransE算法将分类领域库中的知识以三元组的形式,构建知识图谱;/n步骤S03,解析获得的会话信息,获取其中的话题分类,依据该话题分类与知识分类的聚类信息的匹配度,获得对应的知识图谱,依据该对应的知识图谱,响应于该会话信息进行输出。/n

【技术特征摘要】
1.一种基于知识图谱的人机交互方法,其特征在于:所述方法包括:
步骤S01,对样本知识进行分类,构建分领域知识数据的聚类;
步骤S02,对聚类后的知识数据,采用TransE算法将分类领域库中的知识以三元组的形式,构建知识图谱;
步骤S03,解析获得的会话信息,获取其中的话题分类,依据该话题分类与知识分类的聚类信息的匹配度,获得对应的知识图谱,依据该对应的知识图谱,响应于该会话信息进行输出。


2.如权利要求1所述的方法,其特征在于,所述聚类,采用k-means聚类,首先使用映射操作并行地将原始知识数据转换为可聚类的格式,给不同服务器分配互不重复的知识数据,每个服务器根据给定的k值随机选取k个知识数据作为初始聚类中心,并对其按照顺序编号,对知识数据进行初始划分,得到k个聚类作为初始聚类中心后,对每个知识数据执行划分和下述迭代操作:每个服务器在映射阶段分别读出位于本地的知识数据,并计算每个知识数据到各初始聚类中心的距离,将其归属到最近的初始聚类中心,该步骤操作是并行进行的,再将本次聚类结果在缩减过程中返回;
其中缩减过程是得到所有知识数据的聚类结果,并对各服务器聚类结果进行合并后,在每个新的聚类中选取权值最大的知识数据作为新的聚类中心;重复执行上述映射和缩减操作,直到聚类中心不再变化或达到最大迭代次数时,结束迭代,并输出每个知识数据...

【专利技术属性】
技术研发人员:韩国权黄海峰邱张华周伟
申请(专利权)人:太极计算机股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1