一种数据的知识谱图构建方法、装置、设备及存储介质制造方法及图纸

技术编号:20588980 阅读:25 留言:0更新日期:2019-03-16 07:11
本发明专利技术公开了一种数据的知识图谱构建方法、装置、设备及存储介质,该方法包括:获取样本数据,对所述样本数据中的关键词进行字义解析,得到各所述关键词对应的第一属性类别和第一属性子类别,根据预设规则确定第一属性子类别之间的关联关系,根据各所述关键词对应的第一属性类别和第一属性子类别以及所述第一属性子类别之间的关联关系,构建所述样本数据对应的知识图谱,上述技术方案通过对样本数据的关键词进行字义解析,得到不同关键词对应的不同的第一属性类别和第一属性子类别,解决了现有技术中第一属性类别的单一性问题,构建了一种信息更全面的知识图谱,实现了对数据更完整的分类。

【技术实现步骤摘要】
一种数据的知识谱图构建方法、装置、设备及存储介质
本专利技术实施例涉及大数据挖掘
,尤其涉及一种数据的知识图谱构建方法、装置、设备及存储介质。
技术介绍
随着信息化的快速发展,数据爆炸的世界已经迈入了大数据的时代,如何从大数据中提取出有价值的信息,并将其转化为现实可用的资源,用以支撑各种纷繁复杂的业务,是信息
面对的重要命题。过去数年,大数据的相关技术不断发展,云计算、机器学习以及自然语言处理等新兴技术都融入到了大数据处理的领域当中,为大数据的发展起到了明显的推动作用。然而并不是所有问题都可以通过技术手段来解决,对数据的处理需要建立一整套的规范,用来保证各种技术手段的顺利实现,为此现有技术提出了一种人对象数据的处理方法。然而,大数据的时代不只与人相关,还包括各行各业的事务和物品等,例如ERP(EnterpriseResourcePlanning,企业资源计划)和OA(OfficeAutomation,办公自动化)等各类事务性的信息系统层出不穷,物联网的领域也从各类移动终端不断扩张至各种生活设备,这其中的很多信息本身并不是用来描述和刻画人对象的,但都是大数据不可分割的一部分。
技术实现思路
本专利技术实施例提供一种数据的知识图谱构建方法、装置、设备及存储介质,解决了现有技术中第一属性类别的单一性问题,构建了一种信息更全面的知识图谱。第一方面,本专利技术实施例提供一种数据的知识图谱构建方法,包括:获取样本数据;对所述样本数据中的关键词进行字义解析,得到各所述关键词对应的第一属性类别和第一属性子类别;根据预设规则确定第一属性子类别之间的关联关系;根据各所述关键词对应的第一属性类别和第一属性子类别以及所述第一属性子类别之间的关联关系,构建所述样本数据对应的知识图谱。进一步的,在构建所述样本数据对应的知识图谱之后,还包括:获取实际数据;对所述实际数据中的关键词进行字义解析,得到各所述关键词对应的第二属性类别和第二属性子类别;若所述第二属性类别与所述知识图谱上的第一属性类别匹配,且所述第二属性子类别与所述知识图谱上的第一属性子类别匹配,则校验成功。进一步的,该方法还包括:若所述第二属性类别与所述知识图谱上的第一属性类别不匹配,或者所述第二属性子类别与所述知识图谱上的第一属性子类别不匹配,则校验失败;根据所述第二属性类别和所述第二属性子类别调整所述知识图谱中的第一属性类别、第一属性子类别以及第一属性子类别之间的关联关系。进一步的,所述第一属性类别和所述第二属性类别分别包括:人对象,所述第一属性类别和所述第二属性类别还分别包括:地对象、事对象、物对象和组织对象。第二方面,本专利技术实施例还提供一种数据的知识图谱构建装置,该装置包括:第一获取模块,用于获取样本数据;第一解析模块,用于对所述样本数据中的关键词进行字义解析,得到各所述关键词对应的第一属性类别和第一属性子类别;确定模块,用于根据预设规则确定第一属性子类别之间的关联关系;构建模块,用于根据各所述关键词对应的第一属性类别和第一属性子类别以及所述第一属性子类别之间的关联关系,构建所述样本数据对应的知识图谱。进一步的,还包括:第二获取模块,用于在构建所述样本数据对应的知识图谱之后,获取实际数据;第二解析模块,用于对所述实际数据中的关键词进行字义解析,得到各所述关键词对应的第二属性类别和第二属性子类别;第一校验模块,用于若所述第二属性类别与所述知识图谱上的第一属性类别匹配,且所述第二属性子类别与所述知识图谱上的第一属性子类别匹配,则校验成功。进一步的,还包括:第二校验模块,用于若所述第二属性类别与所述知识图谱上的第一属性类别不匹配,或者所述第二属性子类别与所述知识图谱上的第一属性子类别不匹配,则校验失败;调整模块,用于根据所述第二属性类别和所述第二属性子类别调整所述知识图谱中的第一属性类别、第一属性子类别以及第一属性子类别之间的关联关系。进一步的,所述第一属性类别和所述第二属性类别分别包括:人对象,所述第一属性类别和所述第二属性类别还分别包括:地对象、事对象、物对象和组织对象。第三方面,本专利技术实施例还提供一种设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如第一方面所述的数据的知识图谱构建方法。第四方面,本专利技术实施例还提供一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面所述的数据的知识图谱构建方法。本专利技术实施例提供一种数据的知识图谱构建方法、装置、设备及存储介质,通过获取样本数据,对所述样本数据中的关键词进行字义解析,得到各所述关键词对应的第一属性类别和第一属性子类别,根据预设规则确定第一属性子类别之间的关联关系,根据各所述关键词对应的第一属性类别和第一属性子类别以及所述第一属性子类别之间的关联关系,构建所述样本数据对应的知识图谱,通过对样本数据的关键词进行字义解析,得到不同关键词对应的不同的第一属性类别和第一属性子类别,增加了第一属性类别的多样性,进而构建一种信息更全面的知识图谱,实现对数据更完整的分类。附图说明图1为本专利技术实施例一提供的一种数据的知识图谱构建方法的流程图;图2为现实地的知识图谱的示意图;图3为虚拟地的知识图谱的示意图;图4为物对象的知识图谱的示意图;图5为组织对象的知识图谱的示意图;图6为事对象的知识图谱的示意图;图7为本专利技术实施例三提供的一种数据的知识图谱构建方法的流程图;图8为本专利技术实施例四提供的一种数据的知识图谱构建装置的结构图;图9为本专利技术实施例五提供的一种设备的结构图。具体实施方式下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。实施例一图1为本专利技术实施例一提供的一种数据的知识图谱构建方法的流程图,本实施例可适用于对数据进行分类的情况,该方法可以由数据的知识图谱构建装置来执行,该装置可以采用软件和/或硬件的方式实现,可以集成在本地的设备中。具体的,参考图1,该方法包括如下步骤:S110、获取样本数据。样本数据可以是包含多个行业,涉及金融、房地产、医疗卫生和教育等领域的结构化数据,也可以是非结构化数据,其中,结构化数据也可以称为行数据,可以由数据库二维表结构来逻辑表达和实现的数据,非结构化数据是数据结构不规则或不完整,没有预定义的数据模型,不方便用数据库二维表来表现的数据,如办公文档、文本、图像和XML文件等。可选的,在获取样本数据后,可以对样本数据进行预处理以实现对样本数据的准确分类,其中,预处理可以是数据去重、降噪或规范化,实施例对预处理的操作不作限定。S120、对所述样本数据中的关键词进行字义解析,得到各所述关键词对应的第一属性类别和第一属性子类别。具体的,根据数据包含的具体信息,可以将世间万物抽象为地对象、事对象、物对象、组织对象和人对象五类,即第一属性类别包括:地对象、事对象、物对象、组织对象和人对象,其中,地对象为与位置相关的数字化信息,可以为现实中以及能和现实中的地对应的现实地对象,也可以为代表网络应用中不同逻辑空间概念的虚拟地对象。事对象为现实社会和网络应用本文档来自技高网...

【技术保护点】
1.一种数据的知识图谱构建方法,其特征在于,包括:获取样本数据;对所述样本数据中的关键词进行字义解析,得到各所述关键词对应的第一属性类别和第一属性子类别;根据预设规则确定第一属性子类别之间的关联关系;根据各所述关键词对应的第一属性类别和第一属性子类别以及所述第一属性子类别之间的关联关系,构建所述样本数据对应的知识图谱。

【技术特征摘要】
1.一种数据的知识图谱构建方法,其特征在于,包括:获取样本数据;对所述样本数据中的关键词进行字义解析,得到各所述关键词对应的第一属性类别和第一属性子类别;根据预设规则确定第一属性子类别之间的关联关系;根据各所述关键词对应的第一属性类别和第一属性子类别以及所述第一属性子类别之间的关联关系,构建所述样本数据对应的知识图谱。2.根据权利要求1所述的方法,其特征在于,在构建所述样本数据对应的知识图谱之后,还包括:获取实际数据;对所述实际数据中的关键词进行字义解析,得到各所述关键词对应的第二属性类别和第二属性子类别;若所述第二属性类别与所述知识图谱上的第一属性类别匹配,且所述第二属性子类别与所述知识图谱上的第一属性子类别匹配,则校验成功。3.根据权利要求2所述的方法,其特征在于,还包括:若所述第二属性类别与所述知识图谱上的第一属性类别不匹配,或者所述第二属性子类别与所述知识图谱上的第一属性子类别不匹配,则校验失败;根据所述第二属性类别和所述第二属性子类别调整所述知识图谱中的第一属性类别、第一属性子类别以及第一属性子类别之间的关联关系。4.根据权利要求3所述的方法,所述第一属性类别和所述第二属性类别分别包括:人对象,其特征在于,所述第一属性类别和所述第二属性类别还分别包括:地对象、事对象、物对象和组织对象。5.一种数据的知识图谱构建装置,其特征在于,包括:第一获取模块,用于获取样本数据;第一解析模块,用于对所述样本数据中的关键词进行字义解析,得到各所述关键词对应的第一属性类别和第一属性子类别;确定模块,用于根据预设规则确定第一属性子类别之间的关联...

【专利技术属性】
技术研发人员:谢永恒王梅张杨
申请(专利权)人:北京锐安科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1