一种数据匹配方法及装置制造方法及图纸

技术编号:30764116 阅读:18 留言:0更新日期:2021-11-10 12:19
本实施例提供的数据匹配方法及装置,数据库中的数据按照数据的字符串长度不同分别存储在不同的分片存储区间中;在进行数据匹配时,先根据该待匹配数据的字符串长度确定出需要匹配的字符串长度区间。进一步,根据字符串长度与存储空间分片之间的映射关系,确定该字符串长度区间对应的目标存储空间分片。匹配该目标存储空间分片中是否需存在与待匹配数据相匹配的数据得到匹配结果。该方案将数据按字符串长度分片存储,匹配数据的过程中,先根据待匹配数据的字符串长度确定目标存储空间分片,即仅需对数据库中的部分数据进行匹配,无需对全量数据进行匹配,极大地缩小了匹配范围,因此缩短了匹配过程的耗时,提高了数据匹配效率。配效率。配效率。

【技术实现步骤摘要】
一种数据匹配方法及装置


[0001]本专利技术属于数据处理
,尤其涉及一种数据匹配方法及装置。

技术介绍

[0002]在很多数据匹配的应用场景中,待匹配数据通常需要与数据库中百万级的大数据进行全量匹配,数据量大导致整个匹配过程耗时过长,匹配一次耗时几分钟,进而导致返回匹配结果的时间过长。

技术实现思路

[0003]有鉴于此,本专利技术的目的在于提供一种数据匹配方法及装置,以解决相关技术的数据匹配方案匹配过程耗时长的问题,其提供的技术方案如下:
[0004]第一方面,本申请提供了一种数据匹配方法,包括:
[0005]接收待匹配数据;
[0006]根据所述待匹配数据的字符串长度确定需要匹配的字符串长度区间;
[0007]基于字符串长度与存储空间分片之间的映射关系,确定所述字符串长度区间对应的目标存储空间分片;
[0008]查询所述目标存储空间分片中是否存在与所述待查询数据相匹配的数据,得到匹配结果,其中,不同字符串长度的所述准确数据分别存储在不同的存储空间分片内。
[0009]在第一方面一种可能的实现方式中,所述根据所述待匹配数据的字符串长度确定需要匹配的字符串长度区间,包括:
[0010]获取输入的匹配精确度;
[0011]根据所述匹配精确度和所述待匹配数据的字符串长度,计算得到满足所述匹配精确度的字符串长度区间。
[0012]在第一方面另一种可能的实现方式中,所述根据所述匹配精确度和所述待匹配数据的字符串长度,计算得到满足所述匹配精确度的字符串长度区间,包括:
[0013]计算所述待匹配数据的字符串长度与所述匹配精确度的乘积,得到第一字符串长度阈值;
[0014]计算所述待匹配数据的字符串长度与所述匹配精确度的商,得到第二字符串长度阈值;
[0015]以所述第一字符串长度阈值为下限值,以及以所述第二字符串长度阈值为上限值,得到所述字符串长度区间。
[0016]在第一方面又一种可能的实现方式中,所述基于字符串长度与存储空间分片之间的映射关系,确定所述字符串长度区间对应的目标存储空间分片,包括:
[0017]确定所述字符串长度区间包含的各个目标字符串长度;
[0018]基于字符串长度与存储空间分片之间的映射关系,匹配每个所述目标字符串长度对应的目标存储空间分片。
[0019]在第一方面另一种可能的实现方式中,在所述接收待匹配数据之前,所述方法还包括:
[0020]确定各个所述准确数据的字符串长度;
[0021]基于所述字符串长度,分别将各个所述准确数据存储至与所述字符串长度相匹配的存储空间分片中。
[0022]在第一方面又一种可能的实现方式中,所述根据所述字符串长度对各个所述准确数据进行分片存储,包括:
[0023]将所述字符串长度相同的准确数据存储至同一存储空间分片。
[0024]在第一方面另一种可能的实现方式中,所述根据所述字符串长度对各个所述准确数据进行分片存储,包括:
[0025]对于任一存储空间分片,将字符串长度与所述存储空间分片相匹配的准确数据的字符串长度作为key,将所述准确数据存储在value中。
[0026]第二方面,本申请还提供了一种数据匹配装置,包括:
[0027]接收模块,用于接收待匹配数据;
[0028]字符串长度区间确定模块,用于根据所述待匹配数据的字符串长度确定需要匹配的字符串长度区间;
[0029]分片区间定位模块,用于基于字符串长度与存储空间分片之间的映射关系,确定所述字符串长度区间对应的目标存储空间分片;
[0030]数据匹配模块,用于查询所述目标存储空间分片中是否存在与所述待匹配数据相匹配的数据,得到匹配结果,其中,不同字符串长度的所述准确数据存储在不同的存储空间分片内。
[0031]在第二方面一种可能的实现方式中,所述字符串长度区间确定模块包括:
[0032]匹配精确度获取子模块,用于获取输入的匹配精确度;
[0033]长度区间确定子模块,用于根据所述匹配精确度和所述待匹配数据的字符串长度,计算得到满足所述匹配精确度的字符串长度区间。
[0034]在第二方面另一种可能的实现方式中,所述长度区间确定子模块包括:
[0035]区间下限值计算子模块,用于计算所述待匹配数据的字符串长度与所述匹配精确度的乘积,得到第一字符串长度阈值。
[0036]区间上限值计算子模块,用于计算所述待匹配数据的字符串长度与所述匹配精确度的商,得到第二字符串长度阈值。
[0037]区间确定子模块,用于以所述第一字符串长度阈值为下限值,以及以所述第二字符串长度阈值为上限值,得到所述字符串长度区间。
[0038]在第二方面又一种可能的实现方式中,分片区间定位模块,包括:
[0039]长度确定子模块,用于确定各个所述准确数据的字符串长度;
[0040]分片区间确定子模块,用于基于所述字符串长度,分别将各个所述准确数据存储至与所述字符串长度相匹配的存储空间分片中。
[0041]在第二方面再一种可能的实现方式中,分片区间确定子模块,用于:
[0042]将所述字符串长度相同的准确数据存储至同一存储空间分片。
[0043]在第二方面又一种可能的实现方式中,分片区间确定子模块,用于:
[0044]对于任一存储空间分片,将字符串长度与所述存储空间分片相匹配的准确数据的字符串长度作为key,将所述准确数据存储在value中。
[0045]第三方面,本申请还提供了一种电子设备,包括:存储器和处理器;
[0046]所述存储器内存储有可在所述处理器上运行的计算机程序;
[0047]所述处理器执行所述计算机程序使得所述电子设备执行第一方面任一种可能的实现方式所述的数据匹配方法。
[0048]第四方面,本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如第一方面任一种可能的实现方式所述的数据匹配方法。
[0049]第五方面,本申请还提供了一种计算机程序产品,当改计算机程序产品在电子设备上执行时,适于执行初始化有第一方面任一种可能的实现方式所述的数据匹配方法。
[0050]本实施例提供的数据匹配方法,数据库中的数据按照数据的字符串长度不同分别存储在不同的分片存储区间中;接收到待匹配数据后,先根据该待匹配数据的字符串长度确定出需要匹配的字符串长度区间。进一步,根据字符串长度与存储空间分片之间的映射关系,确定该字符串长度区间对应的目标存储空间分片。查询该目标存储空间分片中是否需存在与待匹配数据相匹配的数据得到匹配结果。由上述过程可知,该方案将数据按字符串长度分片存储,匹配数据的过程中,先根据待匹配数据的字符串长度确定目标存储空间分片,极大地缩小了匹配范围,缩短了匹配过程的耗时,因此提高了数据匹配效率。
附图说明...

【技术保护点】

【技术特征摘要】
1.一种数据匹配方法,其特征在于,包括:接收待匹配数据;根据所述待匹配数据的字符串长度确定需要匹配的字符串长度区间;基于字符串长度与存储空间分片之间的映射关系,确定所述字符串长度区间对应的目标存储空间分片;查询所述目标存储空间分片中是否存在与所述待查询数据相匹配的数据,得到匹配结果,其中,不同字符串长度的所述准确数据分别存储在不同的存储空间分片内。2.根据权利要求1所述的方法,其特征在于,所述根据所述待匹配数据的字符串长度确定需要匹配的字符串长度区间,包括:获取输入的匹配精确度;根据所述匹配精确度和所述待匹配数据的字符串长度,计算得到满足所述匹配精确度的字符串长度区间。3.根据权利要求2所述的方法,其特征在于,所述根据所述匹配精确度和所述待匹配数据的字符串长度,计算得到满足所述匹配精确度的字符串长度区间,包括:计算所述待匹配数据的字符串长度与所述匹配精确度的乘积,得到第一字符串长度阈值;计算所述待匹配数据的字符串长度与所述匹配精确度的商,得到第二字符串长度阈值;以所述第一字符串长度阈值为下限值,以及以所述第二字符串长度阈值为上限值,得到所述字符串长度区间。4.根据权利要求1所述的方法,其特征在于,所述基于字符串长度与存储空间分片之间的映射关系,确定所述字符串长度区间对应的目标存储空间分片,包括:确定所述字符串长度区间包含的各个目标字符串长度;基于字符串长度与存储空间分片之间的映射关系,匹配每个所述目标字符串长度对应的目标存储空间分片。5.根据权利要求1至4任一项所述的方法,其特征在于,在所述接收待匹配数据之前,所述方法还包括:确定各个所述准确数...

【专利技术属性】
技术研发人员:梅涛
申请(专利权)人:上海金仕达成括信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1