数据处理方法、装置、设备及计算机存储介质制造方法及图纸

技术编号:33783701 阅读:20 留言:0更新日期:2022-06-12 14:38
本申请公开了一种数据处理方法、装置、设备及计算机存储介质,涉及计算机技术领域。该方法包括:待处理字符串中包含多个连续多个元素,每个连续多个元素组成与目标数据类型的数据格式匹配的数据,获取上述待处理字符串中包含的上述多个连续多个元素;将每个上述连续多个元素组成的字符串转换为至少一个数据对象,每个上述数据对象的数据类型与上述目标数据类型匹配;将转换得到的上述至少一个数据对象存储到内存中。本方法可以减少对计算机硬盘中文件的访问次数,从而解决数据类型转换的速度较慢的问题。较慢的问题。较慢的问题。

【技术实现步骤摘要】
数据处理方法、装置、设备及计算机存储介质


[0001]本专利技术涉及计算机
,尤其涉及一种数据处理方法、装置、设备及计算机存储介质。

技术介绍

[0002]在将一个数据与数据库中存储的数据进行比对时,通常需要对该数据的数据类型进行转换,以使数据比对的过程更加方便快捷。
[0003]目前,对字符串类型数据进行数据类型转换时,采用的方法通常是先将该字符串类型的数据进行分割,并将分割得到的子字符串存储在文件中,再读取文件中的子字符串并将该子字符串转换为指定数据类型的数据。
[0004]但上述方法在分割得到的数据量较大的情况下,数据类型转换的速度会较慢,使数据的转换效率较低。

技术实现思路

[0005]本申请实施例公开了一种数据处理方法、装置、设备及计算机存储介质,以期通过分割待处理字符串中包含的多个连续多个元素,并转换成与目标数据类型匹配的数据对象存储到内存中,可减少对计算机硬盘中文件的访问次数,以便于提高数据类型转换的速度,提高数据的转换效率。
[0006]第一方面,本申请实施例提供了一种数据处理方法,待处理字符串中包含多个连续多个元素,每个连续多个元素组成与目标数据类型的数据格式匹配的数据,上述方法包括:
[0007]获取上述待处理字符串中包含的上述多个连续多个元素;
[0008]将每个上述连续多个元素组成的字符串转换为至少一个数据对象,每个上述数据对象的数据类型与上述目标数据类型匹配;
[0009]将转换得到的上述至少一个数据对象存储到内存中。r/>[0010]在本申请实施例中,上述待处理字符串包括从电子表格中的单元格中读取得到的数据,其中,单元格为上述电子表格中行与列的交叉部分,上述待处理字符串中的元素可以是单元格所在行对应的值和/或单元格所在列对应的值,上述多个连续多个元素包含于上述单元格所在行对应的值和/或单元格所在列对应的值中。具体的,将上述待处理字符串进行分割,可获得上述多个连续多个元素,再通过与上述目标数据类型匹配的数据类型转换方法,可以将每个上述连续多个元素组成的字符串转换为上述至少一个数据对象,并将上述至少一个数据对象存储到内存中。相较于将分割得到的字符串存储在文件中并一一读取转换成上述至少一个数据对象的方法,本申请中直接对分割得到的字符串进行转换并将转换得到的上述数据对象存储在内存中的方式,可减少对计算机硬盘中文件的访问次数,以便于提高数据类型转换的速度,提高数据的转换效率。
[0011]在第一方面一个可能的实施方式中,在上述获取上述待处理字符串中包含的上述
多个连续多个元素之前,上述方法还包括:
[0012]获取上述待处理字符串中包含的字符信息,上述字符信息为用于描述上述待处理字符串中包含的元素的信息;
[0013]根据上述字符信息,确定目标分隔符;
[0014]上述获取上述待处理字符串中包含的上述多个连续多个元素包括:
[0015]根据上述目标分隔符,分割上述待处理字符串,得到上述多个连续多个元素。
[0016]在本实施例中,对于数据格式不同的多个数据,该多个数据中各自包含的字符种类和字符个数会不同,可以理解的,采用相同的分隔符对上述待处理字符串进行分割,可能会导致错误分割上述多个数据。本申请通过上述字符信息中指示的各元素的信息,可以确定上述待处理字符串中的每个连续多个元素组成的数据的数据格式,根据不同的数据格式选择不同的目标分隔符对上述待处理字符串分割,以获得上述多个连续多个元素,提高字符串分割的准确度。
[0017]在第一方面一个可能的实施方式中,在上述根据上述字符信息,确定目标分隔符之前,上述方法还包括:
[0018]根据上述字符信息,向上述待处理字符串中插入目标字符;
[0019]上述根据上述字符信息,确定目标分隔符包括:
[0020]根据上述字符信息和上述目标字符,确定上述目标分隔符。
[0021]在本实施例中,上述目标字符包括字母、数字、数学符号以及标点符号中的任意一项或多项,其中,根据该字符信息所指示的各元素的信息的不同,上述目标字符可以是不同的。可以理解的,在上述待处理字符串中的任意两个或两个以上的上述连续多个元素之间的分隔字符与其中一个或多个上述连续多个元素中的字符相同的情况下,直接以该分隔字符作为上述目标分隔符时,会导致分割错误。本申请通过在上述待处理字符串中插入上述目标字符并根据上述待处理字符串中的元素信息和上述目标字符重新构建目标分隔符的方式,提高字符串分割的准确度。
[0022]在第一方面一个可能的实施方式中,上述根据上述字符信息和上述目标字符,确定上述目标分隔符包括:
[0023]从上述字符信息中获取任意两个相邻的上述连续多个元素之间的间隔字符;
[0024]将上述间隔字符和上述目标字符拼接,得到上述目标分隔符。
[0025]在本实施例中,在上述多个连续多个元素中的任意两个相邻的上述连续多个元素之间的元素即为上述间隔字符,或者,将上述待处理字符串中的任意一个上述连续多个元素视为一个数据项,则上述待处理字符串中的任意两个相邻的数据项之间的元素即为上述间隔字符。其中,由于上述字符信息包含有上述待处理字符串中的元素的信息,因此可根据上述字符信息确定上述间隔字符。可以理解的,将上述间隔字符和上述目标字符拼接构成上述目标分隔符,在分割上述待处理字符串的同时可以过滤上述间隔字符,以提高字符串分割的准确度。
[0026]在第一方面一个可能的实施方式中,在上述根据上述字符信息,向上述待处理字符串中插入目标字符之前,上述方法还包括:
[0027]根据上述字符信息,确定目标索引元素;
[0028]上述根据上述字符信息,向上述待处理字符串中插入目标字符包括:
[0029]根据上述目标索引元素,向上述待处理字符串中插入上述目标字符。
[0030]在本实施例中,上述目标索引元素为上述待处理字符串中的一个或多个元素,且上述目标索引元素包括上述目标数据类型的数据格式中包含的字符。本申请通过该目标索引元素确定上述待处理字符串中的每个上述连续多个元素的序列位置信息,并根据得到的序列位置信息定位插入上述目标字符,使上述目标字符位于任意两个相邻的上述连续多个元素之间,以便于正确分割上述待处理字符串并减少插入上述目标字符所消耗的时间。
[0031]在第一方面一个可能的实施方式中,上述根据上述字符信息,确定目标索引元素包括:
[0032]从上述字符信息中确定每个上述连续多个元素中的结尾元素作为上述目标索引元素。
[0033]在本实施例中,在根据上述目标索引元素插入上述目标字符时,通常需要指定上述目标索引元素和上述目标字符在上述待处理字符串中的间隔长度,可以理解的,上述多个连续多个元素中的每个连续多个元素组成的字符串的长度可能会是各不相同的,因此上述间隔长度也是各不相同的。本申请以每个上述连续多个元素中的结尾元素作为上述目标索引元素,统一每个上述连续多个元素中的目标索引元素与目标字符的本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,其特征在于,待处理字符串中包含多个连续多个元素,每个连续多个元素组成与目标数据类型的数据格式匹配的数据,所述方法包括:获取所述待处理字符串中包含的所述多个连续多个元素;将每个所述连续多个元素组成的字符串转换为至少一个数据对象,每个所述数据对象的数据类型与所述目标数据类型匹配;将转换得到的所述至少一个数据对象存储到内存中。2.根据权利要求1所述的方法,其特征在于,在所述获取所述待处理字符串中包含的所述多个连续多个元素之前,所述方法还包括:获取所述待处理字符串中包含的字符信息,所述字符信息为用于描述所述待处理字符串中包含的元素的信息;根据所述字符信息,确定目标分隔符;所述获取所述待处理字符串中包含的所述多个连续多个元素包括:根据所述目标分隔符,分割所述待处理字符串,得到所述多个连续多个元素。3.根据权利要求2所述的方法,其特征在于,在所述根据所述字符信息,确定目标分隔符之前,所述方法还包括:根据所述字符信息,向所述待处理字符串中插入目标字符;所述根据所述字符信息,确定目标分隔符包括:根据所述字符信息和所述目标字符,确定所述目标分隔符。4.根据权利要求3所述的方法,其特征在于,所述根据所述字符信息和所述目标字符,确定所述目标分隔符包括:从所述字符信息中获取任意两个相邻的所述连续多个元素之间的间隔字符;将所述间隔字符和所述目标字符拼接,得到所述目标分隔符。5.根据权利要求3或4所述的方法,其特征在于,在所述根据所述字符信息,向所述待处理字符串中插入目标字符之前,所述方法还包括:根据所述字符信息,确定目标索引元素;所述根据所述字符信息,向所述待处理字符串中插入目标字符包括:根据所述目标索引元素,向所述待处理字符串中插入所述目标字符。6.根据权利要求5所述的方法,其特征在于,所述根据所述字符信息,确定目标索引元素包括:从所述字符信息中确定每个所述连续多个元素中的结尾元素作为所述目标索引元素。7.根据权利要求5或6所述的方法,其特征在于,所述根据所述目标索引元素,向所述待处理字符串中插入所述目标字符包括:获取所述目标索引元素在所述待处理字符串中的索引值;根据所述索引值,确定所述目标字符在所述待处理字符串中的索引位置;根据所述索引位置,向所述待处理字符串中插入所述目标字符。8.一种数据处理装置,其特征在于,待处理字符串中包含多个连续多个元素,每个连续多个元素组成与目标数据类型的数据格式匹配的数据,所述装...

【专利技术属性】
技术研发人员:黄小芳刘兵
申请(专利权)人:深圳希施玛数据科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1