一种基于知识图谱的视频图像数据构建方法和系统技术方案

技术编号:36555694 阅读:12 留言:0更新日期:2023-02-04 17:10
本发明专利技术公开了一种基于知识图谱的视频图像数据构建方法和系统,包括数据接入,将标准化后的数据和结构化数据发送至消息中间件,并将数据存储至数仓系统;对视图知识图谱进行实体定义和实体发现;将实体发现的结果数据输出至消息中间件,并将实体数据写入图数据库;对视图知识图谱进行实体关系定义和关系发现;将关系发现的结果数据输出至消息中间件,并将关系数据写入图数据库;针对构建好的制图知识图谱利用图计算和图深度学习对关系进行挖掘分析;对关系进行查询并可视化展示;本方案具有智能化实现隐性人员挖掘、团伙发现、风险智能化自动预测预警的特点。化自动预测预警的特点。化自动预测预警的特点。

【技术实现步骤摘要】
一种基于知识图谱的视频图像数据构建方法和系统


[0001]本专利技术涉及视频图像数据构建领域,特别涉及一种基于知识图谱的视频图像数据构建方法和系统。

技术介绍

[0002]视频图像数据属多媒体数据,采集体量大、价值密度低、数据膨胀率高,与传统的结构化数据在数据构成和数据形态上有根本不同,目前基于深度学习的视图智能分析、视图结构化、视频图像聚类等技术已经日趋成熟,可以实现对视图目标的查询、比对和布控等应用,同时针对结构化数据进行规则分析,可以实现视图目标简单的关系分析,由于目前视图数据基于传统关系型数据库进行存储,要实现深层的关系分析和挖掘,则需要依赖多次的分析和计算,从而使得代价相对较高,因此,急需提供一种对视图图像数据进行重新组织,充分利用图谱的挖掘和分析能力来实现视图数据价值的最大化的方法和系统。

技术实现思路

[0003]为此,需要提供一种利用视图AI技术和知识图谱技术对视图数据进行分析挖掘,通过对视图业务数据进行三要素,即:实体、关系、属性定义,构建视图专业领域知识图谱,基于图计算、图挖掘技术实现深层数据挖掘,智能化实现隐性人员挖掘、团伙发现、风险智能化自动预测预警。
[0004]为实现上述目的,专利技术人提供了一种基于知识图谱的视频图像数据构建方法,包括以下步骤:
[0005]S1:数据接入,将标准化后的数据和结构化数据发送至消息中间件,并将数据存储至数仓系统;
[0006]S2:对视图知识图谱进行实体定义和实体发现,根据知识图谱的的实体要求,对视图知识图谱中实体的类型和属性进行定义,根据实体的定义信息,对接入的数据进行实体发现;
[0007]S3:将步骤S2中的实体发现的结果数据输出至消息中间件,并将实体数据写入图数据库,用于关系发现;
[0008]S4:对视图知识图谱进行实体关系定义和关系发现;
[0009]S5:将步骤S4中的关系发现的结果数据输出至消息中间件,并将关系数据写入图数据库,构建视图知识图谱,用于关系查询和关系挖掘;
[0010]S6:针对构建好的制图知识图谱利用图计算和图深度学习对关系进行挖掘分析;
[0011]S7:对关系进行查询并可视化展示。
[0012]作为本专利技术的一种优选方式,步骤S1接入的数据包括:接入多源异构视图数据,所述多源异构视图数据包括视图基础设备信息、人脸、机动车和非机动车抓拍数据;还包括,接入进行了视图聚类的结果数据、置信身份数据以及基于视频分析方法进行分析的结果数据。
[0013]作为本专利技术的一种优选方式,判断步骤S1接入的数据性质,若为视图基础设备数据或视图结构化数据,则对数据进行清洗和标准化;若为,若为原始数据,则进行AI聚类分析;若为聚类后的结果数据,则进行AI置信分析。
[0014]作为本专利技术的一种优选方式,所述AI聚类分析即对标准化后的数据进行分析,若为原始数据,则对数据进行聚类归档;所述AI置信分析即对标准化后的数据进行分析,若为聚类后的结果数据,则根据是否置信决定是否对数据进行置信,用于对聚类档案数据赋予身份信息。
[0015]作为本专利技术的一种优选方式,步骤S2中根据实体的定义信息,对接入的数据进行实体发现包括:根据实体的定义信息,通过实时或离线任务对接入的数据进行实体发现,其中需配置实体中的每个属性和原始字段的映射关系,实时发现是通过对消息中间件的数据进行订阅,按照字段映射关系对实体进行发现,离线发现是根据实体的定义信息,基于数仓系统进行数据分析。
[0016]作为本专利技术的一种优选方式,步骤S4:对视图知识图谱进行实体关系定义和关系发现包括:指定关系的两个实体类型和关系的属性字段,指定关系分析的数据来源,通过任务的方式完成关系发现。
[0017]作为本专利技术的一种优选方式,还包括:
[0018]S8:数据入库程序,用于将消息中间件的每个步骤的数据进行分类处理并入库;
[0019]S9:数据存储组件,包括分布式离线数仓存储组件、图数据库、全文检索存储组件和关系性数据库。
[0020]为实现上述目的,专利技术人提供了一种基于知识图谱的视频图像数据构建系统,包括:
[0021]视图接入模块,用于通过多协议对多源异构视图数据统一接入,并进行数据清洗和标准化;
[0022]视图AI分析模块,用于将接入的视图数据进行AI分析,实现视图结构化、视图实体聚类、视图实体置信及视图实体间关系分析,并将分析结果同步输出推送至消息中间件;
[0023]视图DI分析模块,用于对视图AI分析模块分析结果数据进行整合,并利用机器学习进行数据挖掘分析,实现视图实体间关系分析,并将分析结果同步输出至消息中间件;
[0024]视图数据存储模块,用于对视图接入模块、视图AI分析模块及视图DI分析模块的输出结果提供存储;
[0025]消息中间件模块,用于将结构化数据通过消息方式传递给实体关系分析模块;
[0026]知识定义和发现模块,用于提供对视图实体、关系和属性进行规则定义,使用任务的方式完成实体、关系数据的发现,并将结果存入知识存储模块中;
[0027]知识检索模块,用于提供对实体和关系的检索,并对实体进行关系查找和路径分析;
[0028]知识推理模块,使用深度学习对已经形成的视图知识图谱进行挖掘分析,并对已构建的知识图谱进行治理评估和更新;
[0029]知识存储模块,包括知识定义的配置数据存储、针对实体和关系发现的结果及知识推理模块的结果进行存储、对实体和关系数据进行全文索引的存储、分布式离线数仓存储。
[0030]作为本专利技术的一种优选方式,所述视图数据存储模块,用于对视图接入模块、视图AI分析模块及视图DI分析模块的输出结果提供存储,包括原始接入数据、标准化后数据以及通过数据分析产生的结果数据。
[0031]作为本专利技术的一种优选方式,所述知识定义和发现模块使用任务的方式完成实体、关系数据的发现包括:实时任务通过消费消息中间件中数据或通过离线分析读取数仓系统数据,进行实体和关系数据的发现。
[0032]区别于现有技术,上述技术方案所达到的有益效果有:
[0033](1)提供了一种基于本体的知识模型以及本体类型设计进行视图知识库构建的方法和系统:提出了一种基于知识图谱的视图语义分析流程,采用了知识表达模型对视图数据的对象化语义信息进行描述和抽取,在此基础上基于知识图谱的图像语义知识融合和加工技术,构建视图数据领域知识图谱平台;
[0034](2)提供了一种基于图结构对视图数据进行数据组织及分析的方法和系统,能够将视图关系数据通过知识三元组的形式进行存储,通过利于图结构的路径查找和分析能力,提升了数据查询和分析的效率;
[0035](3)提供了一种基于知识推理技术实现对视图数据实体关系的分析和挖掘的方法和系统,即基于图谱中已有的事实或关系推断出未知的事实或关系,重点应用于隐性关系的挖掘以及知识的推荐等场景。
附图说明
[0036]图1为具体实施方式本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于知识图谱的视频图像数据构建方法,其特征在于,包括以下步骤:S1:数据接入,将标准化后的数据和结构化数据发送至消息中间件,并将数据存储至数仓系统;S2:对视图知识图谱进行实体定义和实体发现,根据知识图谱的的实体要求,对视图知识图谱中实体的类型和属性进行定义,根据实体的定义信息,对接入的数据进行实体发现;S3:将步骤S2中的实体发现的结果数据输出至消息中间件,并将实体数据写入图数据库,用于关系发现;S4:对视图知识图谱进行实体关系定义和关系发现;S5:将步骤S4中的关系发现的结果数据输出至消息中间件,并将关系数据写入图数据库,构建视图知识图谱,用于关系查询和关系挖掘;S6:针对构建好的制图知识图谱利用图计算和图深度学习对关系进行挖掘分析;S7:对关系进行查询并可视化展示。2.根据权利要求1所述的基于知识图谱的视频图像数据构建方法,其特征在于,步骤S1接入的数据包括:接入多源异构视图数据,所述多源异构视图数据包括视图基础设备信息、人脸、机动车和非机动车抓拍数据;还包括,接入进行了视图聚类的结果数据、置信身份数据以及基于视频分析方法进行分析的结果数据。3.根据权利要求1所述的基于知识图谱的视频图像数据构建方法,其特征在于,判断步骤S1接入的数据性质,若为视图基础设备数据或视图结构化数据,则对数据进行清洗和标准化;若为,若为原始数据,则进行AI聚类分析;若为聚类后的结果数据,则进行AI置信分析。4.根据权利要求3所述的基于知识图谱的视频图像数据构建方法,其特征在于:所述AI聚类分析即对标准化后的数据进行分析,若为原始数据,则对数据进行聚类归档;所述AI置信分析即对标准化后的数据进行分析,若为聚类后的结果数据,则根据是否置信决定是否对数据进行置信,用于对聚类档案数据赋予身份信息。5.根据权利要求1所述的基于知识图谱的视频图像数据构建方法,其特征在于,步骤S2中根据实体的定义信息,对接入的数据进行实体发现包括:根据实体的定义信息,通过实时或离线任务对接入的数据进行实体发现,其中需配置实体中的每个属性和原始字段的映射关系,实时发现是通过对消息中间件的数据进行订阅,按照字段映射关系对实体进行发现,离线发现是根据实体的定义信息,基于数仓系统进行数据分析。6.根据权利要求1所述的基于知识图谱的视频图像数据构建方法,其特征在于...

【专利技术属性】
技术研发人员:赵伟伟孙靖宇后欣王昌中
申请(专利权)人:南京启数智能系统有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1