基于工业领域构建知识图谱的方法、装置及存储介质制造方法及图纸

技术编号:21658713 阅读:26 留言:0更新日期:2019-07-20 05:39
本申请公开了一种基于工业领域构建知识图谱的方法、装置及存储介质。其中,该方法,包括:获取与工业领域相关的文本信息;基于预设的深度置信网络,识别所述文本信息中包含的命名实体,其中所述命名实体用于指示所述文本信息中包含的以名称为标识的实体;基于所述预设的深度置信网络,识别所述命名实体之间的命名实体关系;以及根据所述命名实体以及所述命名实体关系,构建基于工业领域的知识图谱。达到了基于工业领域的非结构化的文本信息,利用深度置信网络,有效的进行命名实体以及命名实体关系的识别,从而构建出适用于工业领域的知识图谱。

Method, Device and Storage Medium of Building Knowledge Map Based on Industrial Domain

【技术实现步骤摘要】
基于工业领域构建知识图谱的方法、装置及存储介质
本申请涉及工业领域,特别是涉及一种基于工业领域构建知识图谱的方法、装置及存储介质。
技术介绍
工业领域是国民经济的重中之重,实现工业的智能制造是未来的必由之路。工业升级,包括智能制造工程、工业强基工程、绿色制造工程、高端装备创新工程、高档数控机床和机器人、航空航天装备、海洋工程装备及高技术船舶等国计民生的重点领域,涉及到工业设备模式感知、故障监控、性能检测等大量数据采集分析操作。设备数据的复杂性、多样性、实时性远远不是传统数据库技术所能承载的。基于这些行业痛点,知识图谱这种以可视化技术展示数据结构关系、知识发展的技术在工业领域应用越来越广泛。知识图谱是一种以可视化的方式展示信息中包含的知识要点、核心结构、整体知识架构的技术。近些年工业领域开始青睐知识图谱这一图形化展示方法,实现工业设备数据采集、知识分类、知识存储、知识分析等应用。知识图谱的构建主要包括知识单元的构建、知识单元间关系的构建和知识图谱的结构化展示三个部分,其中前两个任务是构建知识图谱的最基本任务。它充分釆用了可视化的技术,不仅能够对知识资源和载体进行描述,同时还可以对工业知识以及工业知识之间的联系进行分析和描绘。它可以通过数据挖掘、信息分析、计量分析等方法,利用图形将复杂的工业领域绘制并展现出来。知识图谱引入工业领域,解决了工业领域知识构建的问题,但是工业领域的信息相比其他领域更加杂乱无序,大部分信息来源于非结构化的文本,因此对这些信息进行语义分析,提取出能用于绘制知识图谱的知识单元并找出知识单元之间的联系就显得极为重要。提取用于绘制工业知识图谱的知识单元可以映射为对大量信息的命名实体进行识别,而寻找知识单元之间的关系也可以映射为对命名实体关系的识别,两者都可以通过机器学习的方法进行。以往在对命名实体的识别和实体关系识别的时候,人们通常会选择支持向量机(SVM)和条件随机场(CRF)之类的浅层学习方法,浅层学习模型包含的层次较少,对于复杂概念的表征存在一定的局限性。针对上述的现有技术中存在的由于工业领域的信息相比其他领域更加杂乱无序,大部分信息来源于非结构化的文本,因此基于支持向量机(SVM)和条件随机场(CRF)之类的浅层学习方法所构建的知识图谱存在一定的局限性的技术问题,目前尚未提出有效的解决方案。
技术实现思路
本公开的实施例提供了一种基于工业领域构建知识图谱的方法、装置及存储介质,以至少解决现有技术中存在的由于工业领域的信息相比其他领域更加杂乱无序,大部分信息来源于非结构化的文本,因此基于支持向量机(SVM)和条件随机场(CRF)之类的浅层学习方法所构建的知识图谱存在一定的局限性的技术问题。根据本公开实施例的一个方面,提供了一种基于工业领域构建知识图谱的方法,包括:获取与工业领域相关的文本信息;基于预设的深度置信网络,识别文本信息中包含的命名实体,其中命名实体用于指示文本信息中包含的以名称为标识的实体;基于预设的深度置信网络,识别命名实体之间的命名实体关系;以及根据命名实体以及命名实体关系,构建基于工业领域的知识图谱。根据本公开实施例的另一个方面,还提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时由处理器执行以上任意一项所述的方法。根据本公开实施例的另一个方面,还提供了一种基于工业领域构建知识图谱的装置,包括:获取模块,用于获取与工业领域相关的文本信息;第一识别模块,用于基于预设的深度置信网络,识别文本信息中包含的命名实体,其中命名实体用于指示文本信息中包含的以名称为标识的实体;第二识别模块,用于基于预设的深度置信网络,识别命名实体之间的命名实体关系;以及构建模块,用于根据命名实体以及命名实体关系,构建基于工业领域的知识图谱。根据本公开实施例的另一个方面,还提供了一种基于工业领域构建知识图谱的装置,包括:处理器;以及存储器,与处理器连接,用于为处理器提供处理以下处理步骤的指令:获取与工业领域相关的文本信息;基于预设的深度置信网络,识别文本信息中包含的命名实体,其中命名实体用于指示文本信息中包含的以名称为标识的实体;基于预设的深度置信网络,识别命名实体之间的命名实体关系;以及根据命名实体以及命名实体关系,构建基于工业领域的知识图谱。在本公开实施例中,采用预设的深度置信网络,可以有效的对与工业领域相关的文本信息中包含的命名实体以及命名实体关系进行有效的识别,进而根据识别出的命名实体以及识别出的命名实体关系,构建基于工业领域的知识图谱。达到了基于工业领域的非结构化的文本信息,利用深度置信网络,有效的进行命名实体以及命名实体关系的识别,从而构建出适用于工业领域的知识图谱的技术效果。进而解决了现有技术中存在的由于工业领域的信息相比其他领域更加杂乱无序,大部分信息来源于非结构化的文本,因此基于支持向量机(SVM)和条件随机场(CRF)之类的浅层学习方法所构建的知识图谱存在一定的局限性的技术问题。附图说明此处所说明的附图用来提供对本公开的进一步理解,构成本申请的一部分,本公开的示意性实施例及其说明用于解释本公开,并不构成对本公开的不当限定。在附图中:图1是用于实现根据本公开实施例1所述的方法的【计算机终端(或移动设备)】的硬件结构框图;图2是根据本公开实施例1所述的基于工业领域构建知识图谱的系统的示意图;图3是根据本公开实施例1的第一个方面所述的基于工业领域构建知识图谱的方法的流程示意图;图4是根据本公开实施例1的第一个方面所述的深度置信网络的结构示意图;图5是根据本公开实施例1的第一个方面所述的受限玻尔兹曼机的结构示意图;图6是根据本公开实施例1的第一个方面所述的反向传播网络的结构示意图;图7是根据本公开实施例1所述的基于深度学习的工业知识图谱实现流程图;图8是根据本公开实施例2所述的基于工业领域构建知识图谱的装置的示意图;以及图9是根据本公开实施例3所述的基于工业领域构建知识图谱的装置的示意图。具体实施方式为了使本
的人员更好地理解本公开的技术方案,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本公开一部分的实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本公开保护的范围。需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。实施例1根据本实施例,提供了一种基于工业领域构建知识图谱的方法的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。本文档来自技高网
...

【技术保护点】
1.一种基于工业领域构建知识图谱的方法,其特征在于,包括:获取与工业领域相关的文本信息;基于预设的深度置信网络,识别所述文本信息中包含的命名实体,其中所述命名实体用于指示所述文本信息中包含的以名称为标识的实体;基于所述预设的深度置信网络,识别所述命名实体之间的命名实体关系;以及根据所述命名实体以及所述命名实体关系,构建基于工业领域的知识图谱。

【技术特征摘要】
1.一种基于工业领域构建知识图谱的方法,其特征在于,包括:获取与工业领域相关的文本信息;基于预设的深度置信网络,识别所述文本信息中包含的命名实体,其中所述命名实体用于指示所述文本信息中包含的以名称为标识的实体;基于所述预设的深度置信网络,识别所述命名实体之间的命名实体关系;以及根据所述命名实体以及所述命名实体关系,构建基于工业领域的知识图谱。2.根据权利要求1所述的方法,其特征在于,基于预设的深度置信网络,识别所述文本信息中包含的命名实体的操作,包括:对所述文本信息中包含的命名实体进行特征的提取;以及根据所提取的特征的结果,基于所述预设的深度置信网络,识别所述文本信息中包含的命名实体。3.根据权利要求2所述的方法,其特征在于,对所述文本信息中包含的命名实体进行特征的提取的操作,包括提取以下任意一项中的至少一项特征:词特征,其中所述词特征用于描述所述文本信息中包含的词;词性特征,其中所述词性特征用于描述所述文本信息包含的词的词性;词典特征,其中所述词典特征用于描述与命名实体相关的词所组成的词典;词上下文窗口特征,其中所述上下文窗口特征用于描述所述文本信息中连续多个词组成的上下文窗口的规律;以及用于描述所述文本信息中的词对于所述文本信息的重要性的统计特征。4.根据权利要求1所述的方法,其特征在于,基于预设的深度置信网络,识别所述命名实体之间的命名实体关系的操作,包括:对所述命名实体关系进行特征的提取;以及根据所提取的特征的结果,基于所述预设的深度置信网络,识别所述命名实体之间的命名实体关系。5.根据权利要求4所述的方法,其特征在于,对所述命名实体关系进行特征的提取的操作,包括提取以下任意一项中的至少一项特征:实体特征,其中所述实体特征用于描述所述文本信息中包含的命名实体;实体类型特征,其中所述实体类型特征用于描述所述命名实体的类别;实体对相对位置特征,其中所述实体对相对...

【专利技术属性】
技术研发人员:王燕吴奇锋王明
申请(专利权)人:埃睿迪信息技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1