一种数据处理方法、装置、终端设备及存储介质制造方法及图纸

技术编号:24574812 阅读:29 留言:0更新日期:2020-06-21 00:13
本申请适用于计算机技术领域,提供了一种数据处理方法、装置、终端设备及存储介质,所述数据处理方法包括:获取以预设格式存储的源数据;解析所述源数据,确定所述源数据包含的各个父标签对应的数据类别;根据各个所述父标签对应的数据类别和各个所述父标签各自对应的子标签对应的数据子类别,构建数据类别与数据子类别之间的键值对;基于所述数据类别与数据子类别之间的键值对,确定目标数据类别,所述目标数据类别包括具有相互包含关系的所述数据类别和所述数据子类别。通过上述方法能够高效筛选出具有相互包含关系的数据类别。

A data processing method, device, terminal equipment and storage medium

【技术实现步骤摘要】
一种数据处理方法、装置、终端设备及存储介质
本申请属于计算机
,尤其涉及一种数据处理方法、装置、终端设备及存储介质。
技术介绍
目前,常见的开源数据通常以预设格式进行存储,例如汽车厂家提供的基于开放的诊断交互格式标准的可扩展标记语言(XML)格式存储的车源数据。由于预设格式的车源数据通常以数据类别定义标签,导致不同数据类别之间的车源数据可能存在相互包含关系。而现有技术中,很难高效筛选出具有相互包含关系的数据类别,影响数据使用的完整性和准确性。因此,如何快速高效地筛选出具有相互包含关系的数据类别是亟待解决的技术问题。
技术实现思路
本申请的目的在于提供一种数据处理方法、装置、终端设备及存储介质,旨在解决现有技术中很难高效筛选出具有相互包含关系的数据类别的问题。本申请实施例的第一方面提了一种数据处理方法,包括:获取以预设格式存储的源数据;解析所述源数据,确定所述源数据包含的各个父标签对应的数据类别;根据各个所述父标签对应的数据类别和各个所述父标签各自对应的子标签对应的数据子类别,构建数据类别与数据子类别之间的键值对;基于所述数据类别与数据子类别之间的键值对,确定目标数据类别,所述目标数据类别包括具有相互包含关系的所述数据类别和所述数据子类别。在一种可选的实现方式中,所述获取以预设格式存储的源数据,包括:获取以可扩展标记语言格式存储的源数据,所述源数据包括不同的预设可扩展标记语言标签,各个所述预设可扩展标记语言标签与各个所述父标签相互对应,且各个所述预设可扩展标记语言标签对应所述源数据的不同数据类别。在一种可选的实现方式中,所述解析所述源数据,确定所述源数据中各个父标签对应的数据类别,包括:解析所述源数据,分别获取所述源数据包含的所有所述预设可扩展标记语言标签对应的所述数据类别,其中,各个所述预设可扩展标记语言标签对应的所述数据类别分别为各个所述父标签对应的数据类别。在一种可选的实现方式中,在所述根据各个所述父标签对应的数据类别和各个所述父标签各自对应的子标签对应的数据子类别,构建数据类别与数据子类别之间的键值对之后,包括:将所述键值对存储至预先生成的第一关联容器;其中,以各个所述父标签作为所述第一关联容器中的第一对象,以各个所述父标签各自对应的子标签作为各个所述第一对象的子对象,将各个所述第一对象对应的所述数据类别和各个所述第一对象的子对象对应的数据子类别关系存储至所述第一关联容器。在一种可选的实现方式中,所述基于所述数据类别与数据子类别之间的键值对,确定目标数据类别,包括:调用预设的递归函数遍历所述第一关联容器,从所述第一关联容器中获取所述目标数据类别。在一种可选的实现方式中,所述调用预设的递归函数遍历所述第一关联容器,从所述第一关联容器中获取所述目标数据类别,包括:通过所述递归函数的第一层循环,遍历所述第一关联容器中的所有第一对象;通过所述递归函数的第二层循环,分别遍历所述第一层循环遍历到的各个所述第一对象的子对象;分别获取所述第二层循环遍历到的各个所述第一对象的子对象包含的对象;若有所述第一对象的子对象包含的对象中有所述第一对象,则确定所述第一对象对应的数据类别和所述子对象对应的数据子类别为所述目标数据类别。在一种可选的实现方式中,在所述基于所述数据类别与数据子类别之间的键值对,确定目标数据类别之后,还包括:将所有所述目标数据类别存入预先生成的第二关联容器;判断所述第二关联容器中的所有第一对象的子对象是否均为预设数据类别;若是,则确定所述第二层循环结束;若否,则通过所述递归函数的第二层循环,分别遍历所述第一层循环遍历到的各个所述第一对象的子对象,直至所述第二关联容器中的所有第一对象的子对象均为预设数据子类别,确定所述第二层循环结束。本申请实施例的第二方面提了一种数据处理装置,包括:获取模块,用于获取以预设格式存储的源数据;解析模块,用于解析所述源数据,确定所述源数据包含的各个父标签对应的数据类别;构建模块,用于根据各个所述父标签对应的数据类别和各个所述父标签各自对应的子标签对应的数据子类别,构建数据类别与数据子类别之间的键值对;确定模块,用于基于所述数据类别与数据子类别之间的键值对,确定目标数据类别,所述目标数据类别包括具有相互包含关系的所述数据类别和所述数据子类别。在一种可选的实现方式中,所述获取模块具体用于:获取以可扩展标记语言格式存储的源数据,所述源数据包括不同的预设可扩展标记语言标签,各个所述预设可扩展标记语言标签与各个所述父标签对应,且各个所述预设可扩展标记语言标签对应所述源数据的不同数据类别。在一种可选的实现方式中,所述解析模块具体用于:解析所述源数据,分别获取所述源数据包含的所有所述预设可扩展标记语言标签对应的所述数据类别,其中,各个所述预设可扩展标记语言标签对应的所述数据类别分别为各个所述父标签对应的数据类别。在一种可选的实现方式中,还包括:第一存储模块,用于将所述键值对存储至预先生成的第一关联容器;其中,以各个所述父标签作为所述第一关联容器中的第一对象,以各个所述父标签各自对应的子标签作为各个所述第一对象的子对象,将各个所述第一对象对应的所述数据类别和各个所述第一对象的子对象对应的数据子类别关系存储至所述第一关联容器。在一种可选的实现方式中,所述确定模块具体用于:调用预设的递归函数遍历所述第一关联容器,从所述第一关联容器中获取所述目标数据类别。在一种可选的实现方式中,所述确定模块,包括:第一遍历子单元,用于通过所述递归函数的第一层循环,遍历所述第一关联容器中的所有第一对象;第二遍历子单元,用于通过所述递归函数的第二层循环,分别遍历所述第一层循环遍历到的各个所述第一对象的子对象;获取子单元,用于分别获取所述第二层循环遍历到的各个所述第一对象的子对象包含的对象;确定子单元,用于在若有所述第一对象的子对象包含的对象中有所述第一对象,则确定所述第一对象对应的数据类别和所述子对象对应的数据子类别为所述目标数据类别。在一种可选的实现方式中,还包括:第二存储模块,用于将所有所述目标数据类别存入预先生成的第二关联容器;判断模块,用于判断所述第二关联容器中的所有第一对象的子对象是否均为预设数据类别;若是,则确定所述第二层循环结束;若否,则通过所述递归函数的第二层循环,分别遍历所述第一层循环遍历到的各个所述第一对象的子对象,直至所述第二关联容器中的所有第一对象的子对象均为预设数据子类别,确定所述第二层循环结束。本申请实施例的第三方面提了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上第一方面所述方法的步骤。本申请实施例的第四方面提了一种计算机可读存储介质,所述计算机可本文档来自技高网...

【技术保护点】
1.一种数据处理方法,其特征在于,包括:/n获取以预设格式存储的源数据;/n解析所述源数据,确定所述源数据包含的各个父标签对应的数据类别;/n根据各个所述父标签对应的数据类别和各个所述父标签各自对应的子标签对应的数据子类别,构建数据类别与数据子类别之间的键值对;/n基于所述数据类别与数据子类别之间的键值对,确定目标数据类别,所述目标数据类别包括具有相互包含关系的所述数据类别和所述数据子类别。/n

【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:
获取以预设格式存储的源数据;
解析所述源数据,确定所述源数据包含的各个父标签对应的数据类别;
根据各个所述父标签对应的数据类别和各个所述父标签各自对应的子标签对应的数据子类别,构建数据类别与数据子类别之间的键值对;
基于所述数据类别与数据子类别之间的键值对,确定目标数据类别,所述目标数据类别包括具有相互包含关系的所述数据类别和所述数据子类别。


2.如权利要求1所述的数据处理方法,其特征在于,所述获取以预设格式存储的源数据,包括:
获取以可扩展标记语言格式存储的源数据,所述源数据包括不同的预设可扩展标记语言标签,各个所述预设可扩展标记语言标签与各个所述父标签相互对应,且各个所述预设可扩展标记语言标签对应所述源数据的不同数据类别。


3.如权利要求2所述的数据处理方法,其特征在于,所述解析所述源数据,确定所述源数据中各个父标签对应的数据类别,包括:
解析所述源数据,分别获取所述源数据包含的所有所述预设可扩展标记语言标签对应的所述数据类别,其中,各个所述预设可扩展标记语言标签对应的所述数据类别分别为各个所述父标签对应的数据类别。


4.如权利要求3所述的数据处理方法,其特征在于,在所述根据各个所述父标签对应的数据类别和各个所述父标签各自对应的子标签对应的数据子类别,构建数据类别与数据子类别之间的键值对之后,包括:
将所述键值对存储至预先生成的第一关联容器;其中,以各个所述父标签作为所述第一关联容器中的第一对象,以各个所述父标签各自对应的子标签作为各个所述第一对象的子对象,将各个所述第一对象对应的所述数据类别和各个所述第一对象的子对象对应的数据子类别关系存储至所述第一关联容器。


5.如权利要求4所述的数据处理方法,其特征在于,所述基于所述数据类别与数据子类别之间的键值对,确定目标数据类别,包括:
调用预设的递归函数遍历所述第一关联容器,从所述第一关联容器中获取所述目标数据类别。


6.如权利要求5所述的数据处理方法,其特征在于,所述调...

【专利技术属性】
技术研发人员:刘均邓蒙召
申请(专利权)人:深圳市元征科技股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1