南京录信软件技术有限公司专利技术

南京录信软件技术有限公司共有9项专利

  • 本发明涉及计算机算法技术领域,具体公开了一种减少Lucene无字典n‑gram切词占用存储空间的方法,包括如下步骤,S1:输入数据样例;S2:对数据样例进行SNGram切割,获得跳跃倒排表;S3:对步骤S2所获得的数据倒排表进行ngra...
  • 本发明涉及计算机算法技术领域,具体公开了一种地理位置检索方法,包括如下步骤,S1:获取经纬度的morton码,并将其存储在Lucene中的DocValues中;S2:将DocValues中的morton码经纬度的值迁移到Payload中...
  • 本发明公开了一种数据倾斜过载保护方法,包括如下步骤,S1:程序录入sql语句;S2:sql语句的解析过程;S3:生成逻辑计划;S4:优化逻辑计划;S5:物理计划阶段;S6:执行阶段;本发明通过对当前编写的sql语句进行诊断,判断是否会出...
  • 本发明公开了一种基于Spark的索引方法,包括如下步骤,S1:在Spark进程中通过自定义消费接口消费实时数据,数据通过索引接口建立索引;S2:修改lucene的原生索引接口;S3:将整个索引程序、查询接口与Spark的服务结合起来;S...
  • 本发明公开了一种基于Lucene的大索引快速分裂方法,包括以下步骤:利用Linux下文件的软连接原理,在当前新建索引分片目录上进行标记,标记出当前文件所指向的原索引文件存储位置;借助于Lucene的delete from特性,在当前新建...
  • 本发明公开了一种基于Lucene的预计算方法,包括以下几个步骤:S1、数据处理方式的设定;S2、数据的加载;S3、数据的处理;S4、数据的存储;本发明能够以有限的空间换极大的时间,可以获得较好的统计分析的性能;同时保留Lucene的强大...
  • 本发明公开了一种基于Lucene的Payloads压缩方法,包括如下步骤,S1、块内存的设定;S2、数据的加载;S3、块的划分;S4、块的压缩;本发明对Payloads文件进行压缩的同时未影响到Lucene原先的API,不影响其功能,封...
  • 本发明公开了一种基于列存的多列联合存储的方法,涉及多列储存技术领域,步骤如下:S1:对多列创建联合索引,数据入库时干预数据的排序分布(按照group by排序存储)。S2:多列索引中的每一列采用列存储,每一个列数据存储在单独的连续的区域...
  • 本发明公开了一种综合使用多种设备存储海量数据的方法。该方法通过将一张表的多个数据列拆分出来,根据列的数据特点将数据表中的一个或多个列组成一个组,根据每个列簇的数据特点综合使用多种存储设备,从而达到性能与成本的最佳性价比,增强系统的灵活性...
1