一种图谱生成方法、装置、设备及介质制造方法及图纸

技术编号:33202510 阅读:56 留言:0更新日期:2022-04-24 00:41
本发明专利技术实施例提供了一种图谱生成方法、装置、设备及介质,用以生成杂乱无章的数据对应的知识图谱。该方法根据每个文本中记录的信息,生成图谱生成表格,针对图谱生成表格中的每条记录,获取该条记录中的关键词所在的列的目标关键词,创建第一节点,将目标关键词记录在第一节点中,创建该条记录中各属性的目标属性值对应的第二节点,并连接第二节点与第一节点,从而生成该条记录对应的子知识图谱。因为在本发明专利技术实施例中,电子设备首先根据每个文本中记录的信息,生成图谱生成表格,根据该图谱生成表格中的每条记录生成对应的子知识图谱,每个子知识图谱的每个节点中记录有目标关键词或者属性值,从而生成了杂乱无章的数据对应的知识图谱。的知识图谱。的知识图谱。

【技术实现步骤摘要】
一种图谱生成方法、装置、设备及介质


[0001]本专利技术涉及数据处理
,尤其涉及一种图谱生成方法、装置、设备及介质。

技术介绍

[0002]随着科技的发展与时代的进步,越来越多的内容完成了信息化、数字化。随着数字化的程度越来越高,互联网上的数据越来越多,呈几何倍数增长。然而这些海量的数据大多为杂乱无章的数据,绝大部分数据因为无法转换成有效信息而浪费了它的价值。

技术实现思路

[0003]本专利技术实施例提供了一种图谱生成方法、装置、设备及介质,用以生成杂乱无章的数据对应的知识图谱。
[0004]第一方面,本专利技术实施例提供了一种图谱生成方法,所述方法包括:
[0005]根据每个文本中包含的信息,生成图谱生成表格;
[0006]针对所述图谱生成表格中每条记录,获取该条记录中关键词所在的列对应的目标关键词,创建第一节点并将所述目标关键词记录到所述第一节点中;获取该条记录中各属性的目标属性值,创建与目标属性值数量对应的第二节点,并连接每个第二节点与所述第一节点,在每个第二节点中对应记录获取的目标属性值,生成该条记录对应的子知识图谱。
[0007]进一步地,所述方法还包括:
[0008]针对每个目标属性值,判断其他子知识图谱的第三节点中记录的属性值是否与该目标属性值相同,若相同,则将该子知识图谱中记录该目标属性值的第二节点与所述其他子知识图谱中记录该目标属性值的第三节点融合。
[0009]进一步地,所述方法还包括:
[0010]针对所述图谱生成表格中每个属性,将该属性的相同的属性值添加到融合表格;
[0011]针对每个目标属性值,若所述融合表格中包含该目标属性值,且已生成的其他子知识图谱中包含记录该目标属性值的第四节点,将该子知识图谱中记录该目标属性值的第二节点与所述第四节点融合。
[0012]进一步地,所述根据每个文本中包含的信息,生成图谱生成表格包括:
[0013]针对每个文本,根据预先保存的关键词,获取该文本中包含的目标关键词,在所述图谱生成表格中增加一条记录,将所述目标关键词记录到增加的该条记录中关键词对应列;根据预先保存的该目标关键词的每个属性,在该文本中获取该属性对应的目标属性值,并将该目标属性值记录到该条记录中对应属性所在的列。
[0014]第二方面,本专利技术实施例还提供了一种图谱生成装置,所述装置包括:
[0015]生成模块,用于根据每个文本中包含的信息,生成图谱生成表格;
[0016]处理模块,用于针对所述图谱生成表格中每条记录,获取该条记录中关键词所在的列对应的目标关键词,创建第一节点并将所述目标关键词记录到所述第一节点中;获取该条记录中各属性的目标属性值,创建与目标属性值数量对应的第二节点,并连接每个第
二节点与所述第一节点,在每个第二节点中对应记录获取的目标属性值,生成该条记录对应的子知识图谱。
[0017]进一步地,所述处理模块,还用于针对每个目标属性值,判断其他子知识图谱的第三节点中记录的属性值是否与该目标属性值相同,若相同,则将该子知识图谱中记录该目标属性值的第二节点与所述其他子知识图谱中记录该目标属性值的第三节点融合。
[0018]进一步地,所述处理模块,还用于针对所述图谱生成表格中每个属性,将该属性的相同的属性值添加到融合表格;针对每个目标属性值,若所述融合表格中包含该目标属性值,且已生成的其他子知识图谱中包含记录该目标属性值的第四节点,将该子知识图谱中记录该目标属性值的第二节点与所述第四节点融合。
[0019]进一步地,所述生成模块,具体用于针对每个文本,根据预先保存的关键词,获取该文本中包含的目标关键词,在所述图谱生成表格中增加一条记录,将所述目标关键词记录到增加的该条记录中关键词对应列;根据预先保存的该目标关键词的每个属性,在该文本中获取该属性对应的目标属性值,并将该目标属性值记录到该条记录中对应属性所在的列。
[0020]第三方面,本专利技术实施例还提供了一种电子设备,所述电子设备至少包括处理器和存储器,所述处理器用于执行存储器中存储的计算机程序时实现上述任一项所述的图谱生成的步骤。
[0021]第四方面,本专利技术实施例还提供了一种计算机可读存储介质,其存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的图谱生成的步骤。
[0022]由于在本专利技术实施例中,电子设备根据每个文本中记录的信息,生成图谱生成表格,针对图谱生成表格中的每条记录,获取该条记录中的关键词所在的列的目标关键词,创建第一节点,将目标关键词记录在第一节点中,创建该条记录中各属性的目标属性值对应的第二节点,并连接第二节点与第一节点,从而生成该条记录对应的子知识图谱。因为在本专利技术实施例中,电子设备首先根据每个文本中记录的信息,生成图谱生成表格,根据该图谱生成表格中的每条记录生成对应的子知识图谱,每个子知识图谱的每个节点中记录有目标关键词或者属性值,从而生成了杂乱无章的数据对应的知识图谱。
附图说明
[0023]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0024]图1为本专利技术实施例提供的一种图谱生成方法过程示意图;
[0025]图2为本专利技术实施例提供的一种生成的知识图谱示意图;
[0026]图3为本专利技术实施例提供的一种图谱生成装置结构示意图;
[0027]图4为本专利技术提供的一种电子设备结构示意图。
具体实施方式
[0028]下面将结合附图对本专利技术作进一步地详细描述,显然,所描述的实施例仅仅是本
专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本专利技术保护的范围。
[0029]为了生成杂乱无章的数据对应的知识图谱,本专利技术实施例提供了一种图谱生成方法、装置、设备及介质。
[0030]实施例1:
[0031]图1为本专利技术实施例提供的一种图谱生成方法过程示意图,该过程包括以下步骤:
[0032]S101:根据每个文本中保存的信息,生成图谱生成表格。
[0033]本专利技术实施例提供的图谱生成方法应用于电子设备,该电子设备可以为PC或服务器等智能设备。
[0034]在本专利技术实施例中,为了生成图谱,电子设备可以先生成图谱生成表格,后续根据该图谱生成表格生成对应的知识图谱。具体的,可以是电子设备针对接收到的文本,获取文本中包含的关键词及各属性的属性值,在图谱生成表格中新增加一条记录,将获取到的关键词及各属性的属性值对应记录在该新增加的记录中。
[0035]S102:针对所述图谱生成表格中每条记录,获取该条记录中关键词所在的列对应的目标关键词,创建第一节点并将所述目标关键词记录到所述第一节点中;获本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图谱生成方法,其特征在于,所述方法包括:根据每个文本中包含的信息,生成图谱生成表格;针对所述图谱生成表格中每条记录,获取该条记录中关键词所在的列对应的目标关键词,创建第一节点并将所述目标关键词记录到所述第一节点中;获取该条记录中各属性的目标属性值,创建与目标属性值数量对应的第二节点,并连接每个第二节点与所述第一节点,在每个第二节点中对应记录获取的目标属性值,生成该条记录对应的子知识图谱。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:针对每个目标属性值,判断其他子知识图谱的第三节点中记录的属性值是否与该目标属性值相同,若相同,则将该子知识图谱中记录该目标属性值的第二节点与所述其他子知识图谱中记录该目标属性值的第三节点融合。3.根据权利要求1所述的方法,其特征在于,所述方法还包括:针对所述图谱生成表格中每个属性,将该属性的相同的属性值添加到融合表格;针对每个目标属性值,若所述融合表格中包含该目标属性值,且已生成的其他子知识图谱中包含记录该目标属性值的第四节点,将该子知识图谱中记录该目标属性值的第二节点与所述第四节点融合。4.根据权利要求1所述的方法,其特征在于,所述根据每个文本中包含的信息,生成图谱生成表格包括:针对每个文本,根据预先保存的关键词,获取该文本中包含的目标关键词,在所述图谱生成表格中增加一条记录,将所述目标关键词记录到增加的该条记录中关键词对应列;根据预先保存的该目标关键词的每个属性,在该文本中获取该属性对应的目标属性值,并将该目标属性值记录到该条记录中对应属性所在的列。5.一种图谱生成装置,其特征在于,所述装置包括:生成模块,用于根据每个文本中包含的信息,生成图谱生成表格;处理模块,用于针对所述图谱生成表格中每条记录,获取该条记录中关键词所在的列对应的目标关键...

【专利技术属性】
技术研发人员:刘湘韩琪胡欣孙雪松崔丽娟罗联鑫陈林林
申请(专利权)人:航天信息股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1