The invention provides a multi-source vertical knowledge map classification integrated query method based on distributed computing platform. The present invention includes integrated control system, map retrieval service system and query management system, multi-source knowledge map classification model vertical integrated directory construction of integrated control and management system, the storage logic set by category classification of the integrated management in the vertical knowledge map in different positions, and is responsible for receiving query tasks, subtasks and resolution; map search service system to execute the query task, query keywords, knowledge mapping entity based on the relationship between the control group; query execution management management query task and concurrent query sub tasks. The invention can realize parallel query multiple knowledge map, the user does not need to complete the data integration mode of global knowledge mapping entity, group relationship information query based on keywords, can be used to build a cross domain question answering system and application recommendation system platform.
【技术实现步骤摘要】
一种基于分布式计算平台的多源垂直知识图谱分类集成查询方法
本专利技术属于信息处理领域,可用于构建跨领域问答系统和应用系统推荐平台,具体涉及基于分布式计算平台的多源垂直知识图谱分类集成查询技术。
技术介绍
知识图谱本质上是一种叫做语义网络(semanticnetwork)的知识库,即具有有向图结构的一个知识库,其中图的结点代表实体(entity)或者概念(concept),而图的边代表实体/概念之间的各种语义关系。知识图谱(KnowledgeGraph)的概念由谷歌2012年正式提出,旨在实现更智能的搜索引擎,并且于2013年以后开始在学术界和业界普及,被广泛的应用于聊天机器人和问答系统中,用于辅助深度理解人类的语言和支持推理,并提升人机问答的用户体验等。此外,知识图谱还被应用于推荐系统中,通过识别用户行为轨迹中产生的实体和关系,查询知识图谱,系统化挖掘其他相关实体和关系,作为用户可能感兴趣的的推荐结果,以此提升数据分析的能力和推荐效果。知识图谱分为通用知识图谱和垂直知识图谱(或行业知识图谱)。通用知识图谱不面向特定领域,可将其类比为“结构化的百科知识”。这类知识图 ...
【技术保护点】
一种基于分布式计算平台的多源垂直知识图谱分类集成查询方法,其特征在于,包括集成控制管理系统、图检索服务系统和查询控制管理系统;集成控制管理系统构建多源垂直知识图谱分类集成目录,将存储在不同位置的垂直知识图谱集逻辑上按类别进行分类集成管理,同时接收应用服务器的查询任务,将查询任务拆分下发;集成管理控制系统与应用服务器一一对应,不同的应用服务器根据业务需求自定义图谱分类集成目录,控制应用需要检索的知识图谱集;图检索服务系统接收图谱查询子任务,维护任务队列,执行知识图谱查询子任务,检索知识图谱数据;不同的图检索服务系统部署在不同的服务器上,一个图检索服务系统中包含1个知识图谱或多 ...
【技术特征摘要】
2017.06.07 CN 20171042269371.一种基于分布式计算平台的多源垂直知识图谱分类集成查询方法,其特征在于,包括集成控制管理系统、图检索服务系统和查询控制管理系统;集成控制管理系统构建多源垂直知识图谱分类集成目录,将存储在不同位置的垂直知识图谱集逻辑上按类别进行分类集成管理,同时接收应用服务器的查询任务,将查询任务拆分下发;集成管理控制系统与应用服务器一一对应,不同的应用服务器根据业务需求自定义图谱分类集成目录,控制应用需要检索的知识图谱集;图检索服务系统接收图谱查询子任务,维护任务队列,执行知识图谱查询子任务,检索知识图谱数据;不同的图检索服务系统部署在不同的服务器上,一个图检索服务系统中包含1个知识图谱或多个不同知识图谱的图检索引擎;查询控制管理系统用来管理并发查询子任务和查询任务执行情况。2.根据权利要求1所述的多源垂直知识图谱分类集成查询方法,其特征在于,所述的多源垂直知识图谱分类集成目录,由n棵分类集成目录树构成,n为正整数;其中,每棵分类集成目录树的根结点为图谱类别结点;图谱类别结点用来描述图谱类别的信息,该结点的属性包括图谱类别结点的编号、图谱类别名称、是否处于激活状态、图谱类别结点的直接父结点和子结点;图谱类别结点的子结点包含类别图谱配置结点和图谱类别子结点;类别图谱配置结点用来描述属于当前图谱类别的图谱集合,该结点的属性包括类别图谱配置结点的编号、类别图谱配置名称、类别图谱配置结点的直接父结点和子结点;类别图谱配置结点的子结点为图谱结平台点;图谱结点用来描述单个图谱的图数据源配置信息和图检索服务配置信息,该结点的属性包含图谱结点的编号、图谱名称、是否处于激活状态、图谱结点的直接父结点和子结点;图谱结点的子结点包含图数据源配置结点和图检索服务配置结点;图数据源配置结点用来描述当前图谱的所有图数据源配置信息,该结点的属性包含图数据源配置结点的编号、图数据源配置名称、图数据源配置结点的直接父结点和子结点;每个图数据源配置结点下包含有至少1个图数据源结点;图数据源结点用来描述单个图数据源信息,该结点的属性包括图数据源结点的编号、图数据源名称、图数据源数据库类型、图数据源数据库连接地址、连接数据库的认证信息、当前图数据源服务状态以及直接父结点;图检索服务配置结点用来描述当前图谱的查询服务配置信息,该结点的属性包括图检索服务配置结点的编号、图检索服务配置名称、图检索服务配置结点的直接父结点和子结点;每个图检索服务配置结点下包含有至少1个图检索服务结点;图检索服务结点用来描述单个图数据源检索服务信息,该结点的属性包括图检索服务结点的编号、图检索服务名称、检索服务请求协议、检索服务的ip和端口号、图检索服务系统的查询子任务接口名称、对应图谱的检索引擎实现类的类名、当前图数据查询服务状态以及直接父结点;图数据源和检索服务部署在同一台服务器上,或者部署在不同的多台服务器上。3.根据权利要求1或2所述的多源垂直知识图谱分类集成查询方法,其特征在于,所述的集成控制管理系统包括关键词提取模块、图谱分类集成目录管理模块、查询任务接口模块、任务拆分模块以及任务下发模块;关键词提取模块对用户在系统中产生的文本进行分词,将得到的关键词组按词性划分为名词关键词组、动词关键词组和形容词关键词组,构造针对特定知识图谱的分词词库;将知识图谱实体中具有唯一性的属性的属性值或具有指代性的属性的属性值以词性为名词的形式添加至分词词库中;将所有实体的属性名称以词性为形容词的形式添加至分词词库;将关系标签以词性为动词的形式添加至分词词库中;图谱分类集成目录管理模块获取多源垂直知识图谱分类集成目录中待查询的知识图谱列表,包括:知识图谱信息以及待查询图谱对应的处于开启状态的图数据源信息列表和检索服务配置信息列表;查询任务接口模块获取应用系统查询请求,解析请求参数信息获得查询文本信息,调用关键词提取模块,将文本信息转换成相应的名词关键词组、动词关键词组和形容词关键词组,然后将任务信息和转换后的关键词组存入查询任务信息表;任务拆...
【专利技术属性】
技术研发人员:吴继芳,吕江花,陈溪,李岳檑,马世龙,
申请(专利权)人:北京航空航天大学,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。