The embodiment of the present invention discloses a string storage method, a matching method, an electronic device and a readable storage medium. The bitmap formed by arranging the binary sequence of characters of a string is divided into several data blocks in a predetermined manner, and the multiple data blocks are stored in corresponding storage units to store the string, thereby, the string can be stored by selection. At least one bitmap block corresponding to the target string is matched with the corresponding data block corresponding to the matching string in the corresponding storage unit to obtain the alternative set of strings. Thus, a large number of strings that do not match the target string can be filtered through less data exchange, which improves the efficiency of data access and string matching.
【技术实现步骤摘要】
字符串的存储方法、匹配方法、电子设备及可读存储介质
本专利技术涉及计算机
,更具体地,涉及一种字符串的存储方法、匹配方法、电子设备及可读存储介质。
技术介绍
字符串的匹配是指在对应的数据库中获取与目标字符串完全匹配的字符串,是一种数据库的常见操作。随着现代数据量的急剧增长,字符串的数据规模也越来越大,现有技术对字符串的匹配效率已不能与越来越大的数据量相适配,因此,如何更加高效进行字符串的匹配成为了目前亟待解决的问题。
技术实现思路
有鉴于此,本专利技术实施例提供一种字符串的存储方法、匹配方法、电子设备及可读存储介质,以通过较少的数据交换滤除大量与目标字符串不匹配的字符串,提高数据的访问效率和字符串的匹配效率。第一方面,本专利技术实施例提供一种字符串的存储方法,所述方法包括:获取待存储的字符串,其中,所述字符串的各字符为对应的二进制数序列;根据各字符的二进制数序列获取所述字符串对应的第一位图;将所述第一位图按照第一预定长度和第一预定宽度分为多个数据块,并将所述多个数据块分别存储至对应的存储单元中。进一步地,所述根据所述各字符的二进制数序列获取所述字符串对应的第一位图包括:将所述各字符的二进制数序列按照预定维度进行排列以获取所述字符串对应的第一位图,所述预定维度包括第一维度和第二维度。进一步地,所述第一预定宽度为1,所述第一预定长度为处理器的寄存器位数的整数倍,其中,所述第一预定宽度对应的维度与所述预定维度相同,所述第一预定长度对应的维度与所述预定维度相反。进一步地,所述第一维度为列,所述第二维度为行。进一步地,所述将所述各字符的二进制数序列按照预定维度进行 ...
【技术保护点】
1.一种字符串的存储方法,其特征在于,所述方法包括:获取待存储的字符串,其中,所述字符串的各字符为对应的二进制数序列;根据各字符的二进制数序列获取所述字符串对应的第一位图;将所述第一位图按照第一预定长度和第一预定宽度分为多个数据块,并将所述多个数据块分别存储至对应的存储单元中。
【技术特征摘要】
1.一种字符串的存储方法,其特征在于,所述方法包括:获取待存储的字符串,其中,所述字符串的各字符为对应的二进制数序列;根据各字符的二进制数序列获取所述字符串对应的第一位图;将所述第一位图按照第一预定长度和第一预定宽度分为多个数据块,并将所述多个数据块分别存储至对应的存储单元中。2.根据权利要求1所述的方法,其特征在于,所述根据所述各字符的二进制数序列获取所述字符串对应的第一位图包括:将所述各字符的二进制数序列按照预定维度进行排列以获取所述字符串对应的第一位图,所述预定维度包括第一维度和第二维度。3.根据权利要求2所述的方法,其特征在于,所述第一预定宽度为1,所述第一预定长度为处理器的寄存器位数的整数倍,其中,所述第一预定宽度对应的维度与所述预定维度相同,所述第一预定长度对应的维度与所述预定维度相反。4.根据权利要求2或3所述的方法,其特征在于,所述第一维度为列,所述第二维度为行。5.根据权利要求2所述的方法,其特征在于,所述将所述各字符的二进制数序列按照预定维度进行排列以获取所述字符串对应的第一位图包括:响应于所述字符串的长度不满足所述第一预定长度的整数倍,在所述第一预定长度对应的维度上填充0,以使得所述第一预定长度对应的维度上的二进制数序列的长度满足所述第一预定长度的整数倍,从而获取所述字符串对应的第一位图。6.根据权利要求1所述的方法,其特征在于,所述存储单元存储有在已存储的字符串对应的第一位图的相同位置上的数据块。7.一种字符串的匹配方法,其特征在于,所述方法包括:获取目标字符串,其中,所述目标字符串的各字符为对应的二进制数序列;根据所述目标字符串中的各字符的二进制数序列获取所述目标字符串对应的第一位图;将所述目标字符串对应的第一位图按照第一预定长度和第一预定宽度分为多个第一数据块;选择至少一个第一数据块分别与对应的存储单元中的各待匹配字符串对应的第二数据块进行匹配,以获取字符串备选集,所述存储单元中的各第二数据块为已存储的各待匹配字符串对应的第一位图在第一位置上的数据块;其中,所述第一数据块处于所述目标字符串对应的第一位图的第一位置上。8.根据权利要求7所述的方法,其特征在于,所述选择至少一个第一数据块分别与对应的存储单元中的各待匹配字符串对应的第二数据块进行匹配,以获取字符串备选集包括:采用不同的线程并行处理每个所述第一数据块分别与对应的存储单元中的各待匹配字符串对应的第二数据块的匹配过程。9.根据权利要求7所述的方法,其特征在于...
【专利技术属性】
技术研发人员:谢超,郭人通,易小萌,陈婉琴,
申请(专利权)人:上海赜睿信息科技有限公司,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。