多模态图谱构建、信息处理方法、装置、电子设备及介质制造方法及图纸

技术编号:37855078 阅读:10 留言:0更新日期:2023-06-14 22:48
本公开提供了一种多模态图谱构建、信息处理方法、装置、电子设备及介质,涉及人工智能技术领域,尤其涉及知识图谱、自然语言处理、计算机视觉和深度学习技术领域。具体实现方案为:根据场景图表的图像信息,构建视觉知识图谱;根据场景图表的文本信息,构建文本知识图谱;根据视觉知识图谱和文本知识图谱,构建第一中间多模态知识图谱;根据相似关系信息处理第一中间多模态知识图谱,得到目标多模态知识图谱,其中,相似关系信息表征两个对象之间具有等价关系和包含关系中的至少之一的关系信息。等价关系和包含关系中的至少之一的关系信息。等价关系和包含关系中的至少之一的关系信息。

【技术实现步骤摘要】
多模态图谱构建、信息处理方法、装置、电子设备及介质


[0001]本公开涉及人工智能
,尤其涉及知识图谱、自然语言处理、计算机视觉和深度学习
具体地,涉及一种多模态图谱构建、信息处理方法、装置、电子设备及介质。

技术介绍

[0002]随着计算机技术的发展,人工智能技术也得以发展。人工智能技术可以包括计算机视觉技术、语音识别技术、自然语言处理技术、机器学习、深度学习、大数据处理技术及知识图谱技术等。
[0003]人工智能技术在各种领域得到了广泛应用。例如,可以利用人工智能技术构建多模态图谱。

技术实现思路

[0004]本公开提供了一种多模态图谱构建、信息处理方法、装置、电子设备及介质。
[0005]根据本公开的一方面,提供了一种多模态图谱构建方法,包括:根据场景图表的图像信息,构建视觉知识图谱;根据上述场景图表的文本信息,构建文本知识图谱;根据上述视觉知识图谱和上述文本知识图谱,构建第一中间多模态知识图谱;以及,根据相似关系信息处理上述第一中间多模态知识图谱,得到目标多模态知识图谱,其中,上述相似关系信息表征两个对象之间具有等价关系和包含关系中的至少之一的关系信息。
[0006]根据本公开的另一方面,提供了一种信息处理方法,包括:获取待处理信息;以及,利用根据多模态图谱构建方法得到的目标多模态知识图谱处理上述待处理信息,得到处理信息。
[0007]根据本公开的另一方面,提供了一种多模态图谱构建装置,包括:第一构建模块,用于根据场景图表的图像信息,构建视觉知识图谱;第二构建模块,用于根据上述场景图表的文本信息,构建文本知识图谱;第三构建模块,用于根据上述视觉知识图谱和上述文本知识图谱,构建第一中间多模态知识图谱;以及,第一处理模块,用于根据相似关系信息处理上述第一中间多模态知识图谱,得到目标多模态知识图谱,其中,上述相似关系信息表征两个对象之间具有等价关系和包含关系中的至少之一的关系信息。
[0008]根据本公开的另一方面,提供了一种信息处理装置,包括:获取模块,用于获取待处理信息;以及,第二处理模块,用于利用根据多模态图谱构建装置得到的目标多模态知识图谱处理上述待处理信息,得到处理信息。
[0009]根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如本公开所述的方法。
[0010]根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储
介质,其中,所述计算机指令用于使所述计算机执行如本公开所述的方法。
[0011]根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现如本公开所述的方法。
[0012]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0013]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0014]图1示意性示出了根据本公开实施例的可以应用多模态图谱构建方法、信息处理方法及装置的示例性系统架构;
[0015]图2示意性示出了根据本公开实施例的多模态图谱构建方法的流程图;
[0016]图3A示意性示出了根据本公开实施例的根据场景图表的图像信息,构建视觉知识图谱方法的示例示意图;
[0017]图3B示意性示出了根据本公开另一实施例的根据场景图表的图像信息,构建视觉知识图谱方法的示例示意图;
[0018]图3C示意性示出了根据本公开另一实施例的根据场景图表的图像信息,构建视觉知识图谱方法的示例示意图;
[0019]图3D示意性示出了根据本公开另一实施例的根据场景图表的图像信息,构建视觉知识图谱方法的示例示意图;
[0020]图3E示意性示出了根据本公开另一实施例的根据场景图表的图像信息,构建视觉知识图谱方法的示例示意图;
[0021]图3F示意性示出了根据本公开另一实施例的根据场景图表的图像信息,构建视觉知识图谱方法的示例示意图;
[0022]图3G示意性示出了根据本公开另一实施例的根据场景图表的图像信息,构建视觉知识图谱方法的示例示意图;
[0023]图3H示意性示出了根据本公开另一实施例的根据场景图表的图像信息,构建视觉知识图谱方法的示例示意图;
[0024]图3I示意性示出了根据本公开另一实施例的根据场景图表的图像信息,构建视觉知识图谱方法的示例示意图;
[0025]图4A示意性示出了根据本公开实施例的根据场景图表的文本信息,构建文本知识图谱方法的示例示意图;
[0026]图4B示意性示出了根据本公开另一实施例的根据场景图表的文本信息,构建文本知识图谱方法的示例示意图;
[0027]图4C示意性示出了根据本公开另一实施例的根据场景图表的文本信息,构建文本知识图谱方法的示例示意图;
[0028]图5示意性示出了根据本公开实施例的根据视觉知识图谱和文本知识图谱,构建第一中间多模态知识图谱方法的示例示意图;
[0029]图6示意性示出了根据本公开实施例的根据相似关系信息处理第一中间多模态知识图谱,得到目标多模态知识图谱方法的示例示意图;
[0030]图7示意性示出了根据本公开实施例的信息处理方法的流程图;
[0031]图8示意性示出了根据本公开实施例的多模态图谱构建装置的框图;
[0032]图9示意性示出了根据本公开实施例的信息处理装置的框图;以及
[0033]图10示意性示出了根据本公开实施例的适于实现多模态图谱构建方法和信息处理方法的电子设备的框图。
具体实施方式
[0034]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0035]本公开实施例提出了一种多模态图谱构建方案。例如,根据场景图表的图像信息,构建视觉知识图谱。根据场景图表的文本信息,构建文本知识图谱。根据视觉知识图谱和文本知识图谱,构建第一中间多模态知识图谱。根据相似关系信息处理第一中间多模态知识图谱,得到目标多模态知识图谱。相似关系信息表征两个对象之间具有等价关系和包含关系中的至少之一的关系信息。
[0036]根据本公开的实施例,由于相似关系信息是表征两个对象之间具有等价关系和包含关系中的至少之一的关系信息,因此,相似关系信息能够提供细粒度关系信息,由此,通过根据相似关系信息对根据场景图表的视觉知识图谱和文本知识图谱构建得到的第一中间多模态知识图谱进行补充,得到目标多本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种多模态图谱构建方法,包括:根据场景图表的图像信息,构建视觉知识图谱;根据所述场景图表的文本信息,构建文本知识图谱;根据所述视觉知识图谱和所述文本知识图谱,构建第一中间多模态知识图谱;以及根据相似关系信息处理所述第一中间多模态知识图谱,得到目标多模态知识图谱,其中,所述相似关系信息表征两个对象之间具有等价关系和包含关系中的至少之一的关系信息。2.根据权利要求1所述的方法,其中,所述根据场景图表的图像信息,构建视觉知识图谱,包括:基于形态学方法处理所述场景图像的图像信息,得到至少一个第一中间图像信息;对所述至少一个第一中间图像信息进行数据增强,得到多个目标图像信息;以及根据所述多个目标图像信息,构建所述视觉知识图谱。3.根据权利要求2所述的方法,其中,所述基于形态学方法处理所述场景图像的图像信息,得到至少一个第一中间图像信息,包括:确定所述场景图像的图像信息的连通域信息,得到至少一个连通域图像信息;对所述至少一个连通域图像信息进行组合,得到至少一个组合图像信息;以及根据所述至少一个组合图像信息,得到所述至少一个第一中间图像信息。4.根据权利要求2或3所述的方法,其中,所述对所述至少一个第一中间图像信息进行数据增强,得到多个目标图像信息,包括:对所述至少一个第一中间图像信息进行基本数据增强,得到多个第二中间图像信息;根据多个第一目标中间图像信息中的任意两个第一目标中间图像信息,确定至少一个像素统计值集,其中,所述第一目标中间图像信息是所述多个第二中间图像信息中的;根据所述至少一个像素统计值集,确定至少一个第三中间图像信息;以及根据所述多个第二中间图像信息和所述至少一个第三中间图像信息,得到所述多个目标图像信息。5.根据权利要求2或3所述的方法,其中,所述对所述至少一个第一中间图像信息进行数据增强,得到多个目标图像信息,包括:根据与所述至少一个第一中间图像信息对应的标签信息,从所述至少一个第一中间图像信息中确定至少一个目标中间图像信息集,其中,所述目标中间图像信息集包括的第二目标中间图像信息的数目小于或等于预定阈值;针对所述至少一个目标中间图像信息集中的目标中间图像信息集,针对所述目标中间信息集中的第二目标中间图像信息,根据所述第二目标中间图像信息与其他第二目标中间图像信息之间的相似度,从所述目标中间信息集中确定相似中间图像信息集;根据所述第二目标中间图像信息和所述相似中间图像信息集,确定与所述第二目标中间图像信息对应的至少一个目标图像信息;以及根据与所述至少一个目标中间图像信息集对应的至少一个目标图像信息,得到所述多个目标图像信息。6.根据权利要求2~5中任一项所述的方法,其中,所述根据所述多个目标图像信息,构
建所述视觉知识图谱,包括:对所述多个目标图像信息进行特征提取,得到与所述多个目标图像信息各自对应的视觉特征;根据与所述多个目标图像信息各自对应的视觉特征,得到与所述多个目标图像信息各自对应的至少一个视觉区域特征;根据与所述多个目标图像信息各自对应的至少一个视觉区域特征,确定与所述多个目标图像信息各自对应的至少一个第一实体和所述至少一个第一实体之间的至少一个第一关系;以及根据与所述多个目标图像信息各自对应的至少一个第一实体和所述至少一个第一实体之间的至少一个第一关系,构建所述视觉知识图谱。7.根据权利要求6所述的方法,其中,所述对所述多个目标图像信息进行特征提取,得到与所述多个目标图像信息各自对应的视觉特征,包括:对所述多个目标图像信息进行特征提取,得到与所述多个目标图像信息各自对应的至少一个尺度的第一特征图;以及根据与所述多个目标图像信息各自对应的至少一个尺度的第一特征图,得到与所述多个目标图像信息各自对应的视觉特征。8.根据权利要求7所述的方法,其中,所述对所述多个目标图像信息进行特征提取,得到与所述多个目标图像信息各自对应的至少一个尺度的第一特征图,包括:针对所述多个目标图像信息中的目标图像信息,对所述目标图像信息进行M个阶段的特征提取,得到与第M阶段对应的至少一个第一特征图;以及根据与所述第M阶段对应的至少一个第一特征图,得到与所述目标图像信息对应的至少一个尺度的第一特征图;其中,第m阶段具有T
m
个并联层级,同一并联层级的第一特征图的图像分辨率相同,不同并联层级的第一特征图的图像分辨率不同;其中,M是大于1或等于1的整数,m是大于或等于1且小于或等于M的整数,T
m
是大于或等于1的整数。9.根据权利要求8所述的方法,其中,在M是大于1的整数的情况下,所述对所述目标图像信息进行M个阶段的特征提取,得到与第M阶段对应的至少一个第一特征图,包括:对与第m

1阶段对应的至少一个第一特征图进行卷积处理,得到与第m阶段对应的至少一个第二特征图;以及对与所述第m阶段对应的至少一个第二特征图进行特征融合,得到与第m阶段对应的至少一个第一特征图;其中,m是大于1且小于或等于M的整数。10.根据权利要求9所述的方法,其中,所述对与所述第m阶段对应的至少一个第二特征图进行特征融合,得到与第m阶段对应的至少一个第一特征图,包括:针对所述T
m
个并联层级中的第i个并联层级,根据与所述第i个并联层级对应的其他第二特征图和与所述第i个并联层级对应的第二特征图,得到与所述第i个并联层级对应的第一特征图;
其中,与所述第i个并联层级对应的其他第二特征图是与所述T
m
个并联层级中除所述第i个并联层级以外的至少部分并联层级对应的第二特征图,i是大于或等于1且小于或等于T
m
的整数。11.根据权利要求7所述的方法,其中,所述对所述多个目标图像信息进行特征提取,得到与所述多个目标图像信息各自对应的至少一个尺度的第一特征图,包括:针对所述多个目标图像信息中的目标图像信息,对所述目标图像信息进行N个级联层级的特征提取,得到与所述目标图像信息对应的至少一个尺度的第一特征图,其中,N是大于1的整数。12.根据权利要求6~11中任一项所述的方法,其中,所述根据与所述多个目标图像信息各自对应的视觉特征,得到与所述多个目标图像信息各自对应的至少一个视觉区域特征,包括:针对所述多个目标图像信息中的目标图像信息,根据与所述目标图像信息对应的视觉特征,得到至少一个第一热力图和至少一个第一偏移图;根据所述至少第一热力图和所述至少一个第一偏移图,确定与所述目标图像信息对应的至少一个第一检测框;根据与所述目标图像信息对应的至少一个第一检测框,确定与所述目标图像信息对应的至少一个第一目标图像区域信息;以及根据与所述目标图像信息对应的至少一个第一目标图像区域信息,确定与所述目标图像信息对应的至少一个视觉区域特征。13.根据权利要求12所述的方法,其中,所述至少一个第一热力图包括中心热力图和至少一个第一边缘热力图;其中,所述根据所述至少第一热力图和所述至少一个第一偏移图,确定与所述目标图像信息对应的至少一个第一检测框,包括:根据所述至少一个第一边缘热力图和所述至少一个第一偏移图,确定至少一个第一候选边缘点;根据所述至少一个第一候选边缘点,确定至少一个第一候选边缘点集;确定与所述至少一个第一...

【专利技术属性】
技术研发人员:肖钧文
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1