一种数据处理方法、装置、电子设备和存储介质制造方法及图纸

技术编号:26222814 阅读:26 留言:0更新日期:2020-11-04 10:53
本申请公开了一种数据处理方法、装置、电子设备和存储介质,涉及知识图谱领域,可用于云平台或云计算。具体实现方案为:一种数据处理方法,包括:从第一数据库中获取第一数据,其中,所述第一数据包括多个子数据;识别所述多个子数据中具备目标关系的子数据,并生成目标数据,所述目标数据包括所述具备目标关系的子数据,以及所述目标关系的关系信息;将所述目标数据存入关系图谱。本申请提供的一种数据处理方法、装置、电子设备和存储介质,可以解决现有技术中,在分析各数据源的第一数据之间的关联关系时,存在的耗时较长的问题。

【技术实现步骤摘要】
一种数据处理方法、装置、电子设备和存储介质
本申请涉及数据处理领域中的知识图谱领域,具体涉及一种数据处理方法、装置、电子设备和存储介质。
技术介绍
随着数据采集技术的飞速发展,特定人员可以从不同数据源获取与案件处理相关的第一数据。在获取到不同数据源的第一数据之后,由于各数据源的第一数据的数据构成通常不同,因此,需要特定人员人为厘清来自于各数据源的第一数据之间的关联关系,以从中获取到关键证据。
技术实现思路
本申请提供了一种数据处理方法、装置、电子设备和存储介质。本申请的一方面,提供了一种数据处理方法,包括:从第一数据库中获取第一数据,其中,所述第一数据包括多个子数据;识别所述多个子数据中具备目标关系的子数据,并生成目标数据,所述目标数据包括所述具备目标关系的子数据,以及所述目标关系的关系信息;将所述目标数据存入关系图谱。本申请的二方面,提供了一种数据处理装置,包括:获取模块,用于从第一数据库中获取第一数据,其中,所述第一数据包括多个子数据;识别模块,用于识别所述多个子数据中具备目标关系的子数据,并生成目标数据,所述目标数据包括所述具备目标关系的子数据,以及所述目标关系的关系信息;存储模块,用于将所述目标数据存入关系图谱。本申请的三方面,提供了一种电子设备,其特征在于,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行所述数据处理方法。本申请的四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行所述数据处理方法。根据本申请的技术解决了现有技术中,在分析各数据源的第一数据之间的关联关系时,存在的耗时较长的问题。应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。附图说明附图用于更好地理解本方案,不构成对本申请的限定。其中:图1是本申请实施例提供的数据处理方法的流程图之一;图2是本申请实施例中直接单次关系的结构示意图;图3是本申请实施例中直接持续关系的结构示意图;图4是本申请实施例中间接单次关系的结构示意图;图5是本申请实施例中间接持续关系的结构示意图;图6是本申请实施例提供的数据处理方法的流程图之二;图7是本申请实施例中将第一数据导入关系抽取模型的结构示意图;图8是本申请实施例提供的数据处理方法的流程图之三;图9是本申请实施例提供的数据处理装置的结构示意图;图10是用来实现本申请实施例的数据处理方法的电子设备的框图。具体实施方式以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。请参见图1,图1是本申请实施例提供的一种数据处理方法,包括:步骤S101、从第一数据库中获取第一数据,其中,所述第一数据包括多个子数据。上述第一数据库可以存储来自于一个数据源的第一数据,也可以存储来自于多个不同数据源的第一数据。其中,所述第一数据可以是指数据采集设备所采集的第一数据、互联网数据、以及特定人员线下人工采集的数据,例如,可以是道路交通路口的监控装置所拍摄到的影像数据、也可以是网民在互联网所发布的数据、还可以是特定人员在公共场所人工采集到的流动人员的身份信息及人脸信息等数据。上述第一数据中的子数据可以是指第一数据中所携带的数据。例如,当所述第一数据为监控设备基于所拍摄的照片所生成的数据时,假设所述照片中包括车辆的车牌号、驾驶员的人脸特征等数据,所述监控设备中记录了拍摄该照片时的时间、以及监控设备的ID号等信息,其中,基于所述监控设备的ID号可以确定拍摄的地点。在此情形下,所述第一数据可以包括如下子数据:车辆的车牌号、驾驶员的人脸特征、监控设备的ID号等,其中,拍摄的地点可以作为所述子数据监控设备的ID号的属性信息,拍摄该照片时的时间可以作为车牌号的属性信息。又例如,当所述第一数据为特定人员在公共场所人工采集到的流动人员的身份信息及人脸信息等数据时,所述第一数据可以包括如下子数据:流动人员的身份信息、人脸照片、采集的时间、采集的地点等。具体地,每个数据源所生成的第一数据可以是具有固定数据结构的数据,不同的数据源所生成的第一数据的数据结构可以不同。所述第一数据中可以包括字段说明,以及与字段说明对应的具体数据,例如,所生成的第一数据可以是:[车辆的车牌号:XXX1;驾驶员的人脸特征:XXX2;监控设备的ID号:XXX3],其中,车辆的车牌号、驾驶员的人脸特征、监控设备的ID号为字段说明,XXX1、XXX2、XXX3为与字段说明对应的具体数据,也即上述子数据。这样,通过生成具有固定数据结构的数据,以便于后续对第一数据进行识别。步骤S102、识别所述多个子数据中具备目标关系的子数据,并生成目标数据,所述目标数据包括所述具备目标关系的子数据,以及所述目标关系的关系信息。上述目标关系可以是通用的关系类型,例如,可以是存在关系、存在直接关系、存在间接关系等通用的关系类型,这样,各种类型的第一数据的子数据之间的关系均可通过该目标关系进行表达。以便于后续将各种类型的第一数据中所携带的子数据之间的关系在同一关系图谱中体现。其中,所述第一数据中通常携带了各子数据之间的关联关系,例如,当所述第一数据为:[车辆的车牌号:XXX1;驾驶员的人脸特征:XXX2;监控设备的ID号:XXX3]时,由于车辆的车牌号、驾驶员的人脸特征均是通过监控设备直接拍摄到的数据,因此,XXX1与XXX3之间存在直接关系、XXX2与XXX3之间存在直接关系,通过确定此类关系,可以确定目标车辆与目标人物的轨迹信息等。又由于车辆的车牌号与驾驶员的人脸特征出现于同一张照片中,即车辆的车牌号与驾驶员的人脸特征通过监控设备建立了的联系,因此,XXX1与XXX2之间存在间接关系,通过获取该关系,以便于后续确定驾驶该车辆的人是否为该车辆的车主等信息。基于此,该案例中,可以识别到的目标数据可以是以下数据中的至少一种:[XXX1,XXX3,直接关系]、[XXX2,XXX3,直接关系]、[XXX1,XXX2,间接关系]等。步骤S103、将所述目标数据存入关系图谱。具体地,由于所述目标数据中包括具备目标关系的子数据,以及所述目标关系的关系信息,因此,在将目标数据存入关系图谱时,为了使关系图谱可以清晰的体现出各子数据之间的关系,可以将目标数据中的每个子数据作为所述关系图谱中的一个连接节点,并本文档来自技高网...

【技术保护点】
1.一种数据处理方法,包括:/n从第一数据库中获取第一数据,其中,所述第一数据包括多个子数据;/n识别所述多个子数据中具备目标关系的子数据,并生成目标数据,所述目标数据包括所述具备目标关系的子数据,以及所述目标关系的关系信息;/n将所述目标数据存入关系图谱。/n

【技术特征摘要】
1.一种数据处理方法,包括:
从第一数据库中获取第一数据,其中,所述第一数据包括多个子数据;
识别所述多个子数据中具备目标关系的子数据,并生成目标数据,所述目标数据包括所述具备目标关系的子数据,以及所述目标关系的关系信息;
将所述目标数据存入关系图谱。


2.根据权利要求1所述的方法,其中,所述关系图谱包括多个连接节点,每个连接节点存储一个不同的子数据,所述将所述目标数据存入关系图谱包括:
在所述关系图谱中确定与所述目标数据中的子数据一一对应的目标连接节点,其中,所述目标连接节点为存储所述目标数据中的子数据的连接节点;
在所述关系图谱中,连接具有所述目标关系的子数据所对应的所述目标连接节点。


3.根据权利要求2所述的方法,其中,所述在所述关系图谱中确定与所述目标数据中的子数据一一对应的目标连接节点,包括:
在所述多个连接节点中不包括第一目标节点的情况下,在所述关系图谱中创建所述第一目标节点,其中,所第一目标节点为存储所述目标数据中的任一子数据的连接节点;
将所述第一目标节点确定为所述目标连接节点。


4.根据权利要求1所述的方法,其中,所述识别所述多个子数据中具备目标关系的子数据,并生成目标数据之前,所述方法还包括:
确定所述目标关系,其中,所述目标关系为用户在至少两个预设关系中所选中的关系,所述至少两个预设关系包括直接关系和间接关系。


5.根据权利要求2所述的方法,其中,所述将所述目标数据存入关系图谱之后,所述方法还包括:
接收用户的第一查询指令,其中,所述第一查询指令包括第二目标节点和所述目标关系,所述第二目标节点为所述多个连接节点中的任一连接节点;
基于所述第一查询指令对所述关系图谱进行查询,得到目标关系图谱,其中,所述目标关系图谱包括所述第二目标节点,以及所述多个连接节点中与所述第二目标节点具有所述目标关系的连接节点。


6.一种数据处理装置,包括:
获取模块,用于从第一数据库中获取第一数据,其中,所述第一数据包括多个子数据;
识别模块,用于识别所述多个子数据中具备目标关系的子数据,并生成目标数...

【专利技术属性】
技术研发人员:杨双全张倩张阳谢奕刘畅张雪婷
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1