基于编码的字符串检索方法、装置及电子设备制造方法及图纸

技术编号:24574877 阅读:43 留言:0更新日期:2020-06-21 00:14
本公开实施例中提供了一种基于编码的字符串检索方法、装置及电子设备,属于数据处理技术领域,该方法包括:对字符串的长度进行计算,以得到字符串长度值L;将所述字符串中所有字符值的总和进行基于N值的取模运算,得到所述字符串的编码值C;基于所述字符串长度值L和所述字符串的编码值C,构建所述字符串的索引值列表;基于所述索引值列表中的编码,对字符串执行检索操作。通过本公开的处理方案,提高了字符串的检索效率。

String retrieval method, device and electronic equipment based on coding

【技术实现步骤摘要】
基于编码的字符串检索方法、装置及电子设备
本公开涉及数据处理
,尤其涉及一种基于编码的字符串检索方法、装置及电子设备。
技术介绍
在计算机领域,联机分析处理OLAP指的是对多维数据的分析查询。当今的数OLTP是传统的关系型数据库的主要应用,主要是基本的、日常的事务处理,例如银行交易。OLAP是数据仓库系统的主要应用,支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果。一般来说,OLAP分为ROLAP和MOLAP。其中ROLAP指的是RelationalOLAP,具体说来是在关系型数据库之上的多维建模。比如IBMCognosFrameworkManager的MDR建模。MOLAP,则直接基于多维数据库。比如TM1、Essbase、PowerCube。OLAP工具是一种数据分析软件。对于TM1,它是直接基于多维数据库的工具;而对于其他的ROLAP工具,则是基于关系型数据库的多维模型或视图,工具则是提供了一层封装,使得关系型数据库也可以支持多维查询。当然,本质上,ROLAP依然是关系型查询。在诸如OLAP之类的大数据场本文档来自技高网...

【技术保护点】
1.一种基于编码的字符串检索方法,其特征在于,包括:/n对字符串的长度进行计算,以得到字符串长度值L;/n将所述字符串中所有字符值的总和进行基于N值的取模运算,得到所述字符串的编码值C;/n基于所述字符串长度值L和所述字符串的编码值C,构建所述字符串的索引值列表;/n基于所述索引值列表中的编码,对字符串执行检索操作。/n

【技术特征摘要】
1.一种基于编码的字符串检索方法,其特征在于,包括:
对字符串的长度进行计算,以得到字符串长度值L;
将所述字符串中所有字符值的总和进行基于N值的取模运算,得到所述字符串的编码值C;
基于所述字符串长度值L和所述字符串的编码值C,构建所述字符串的索引值列表;
基于所述索引值列表中的编码,对字符串执行检索操作。


2.根据权利要求1所述的方法,其特征在于,所述对字符串的长度进行计算,包括:
设置字符串长度计算函数;
基于所述字符串长度计算函数,计算所述字符串的长度。


3.根据权利要求2所述的方法,其特征在于,所述基于所述字符串长度计算函数,计算所述字符串的长度,包括:
判断所述字符串中是否包含结束符;
若是,统计结束符之前字符串中字符的个数,以获得所述字符串的长度。


4.根据权利要求1所述的方法,其特征在于,所述将所述字符串中所有字符值的总和进行基于N值的取模运算之前,所述方法还包括:
预先设置用于取模计算的N值。


5.根据权利要求1所述的方法,其特征在于,所述将所述字符串中所有字符值的总和进行基于N值的取模运算之前,所述方法还包括:
预先计算所述字符串中所有字符值的总和。


6.根据权利要求1所述的方法,其特征在于,所述基于所述字符串长度值L和所述字符串的编码值C,构建所述字符串的索引值列表,包括:
将所述字符长度值L相等的字符分在同一个大组;
在所述大组内,将具有相同字符串的编码值C的字符串分配在同一个小组;
对每个小组内包含的字符串进行索引值设置。


7.根据权利要...

【专利技术属性】
技术研发人员:李育国刘建辉舒彦博
申请(专利权)人:北京字节跳动网络技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1