The invention discloses a query method to optimize the multi index of the search engine, which includes three parts: data storage, data dividing table and data retrieval. The invention can quickly and batch search for large scale and convenient for data; the invention eliminates the multi database and multi table problem made by the call square database sub table; the invention can be used to solve the problem. Over middleware masquerading multi library and multi tables greatly reduces the complexity and error probability of the caller code. In addition, the invention realizes the decoupling operation of the business caller database, and can seamlessly switch the underlying data storage scheme through the middleware camouflage.
【技术实现步骤摘要】
一种优化搜索引擎多索引的查询方法
本专利技术涉及数据处理
,具体为一种优化搜索引擎多索引的查询方法。
技术介绍
现有领域中数据存储形式多为关系型数据库,当数据量超过百万时就需要进行分库分表操作。否则将造成查询堵塞,严重影响调用方使用,情况严重更会导致拖垮数据库使业务瘫痪。
技术实现思路
本专利技术的目的在于提供一种优化搜索引擎多索引的查询方法,以解决上述
技术介绍
中提出的问题。为实现上述目的,本专利技术提供如下技术方案:一种优化搜索引擎多索引的查询方法,包括数据存储,数据分表,数据检索三部分;具体步骤为:A、通过在流中源源不断的获取数据,并针对数据特有的结构进行分索引规则匹配.完成数据的分索引操作;B、调用方发起检索数据请求,经过特殊处理以及规则匹配对所需数据进行分索引同时请求;C、对请求得到的数据进行分类整合,然后返回给调用方。优选的,所述步骤C中数据分类整合方法包括以下步骤:A、识别数据库中每个训练样本的类别;B、在预设样本数据库中分别选取第一训练样本集和第二训练样本集,每个训练样本集都包含有所述预设样本数据库中所有类别的多个训练样本;C、确定第一训练样本集中每一类别的训练样本的平均样本;利用预设迭代算法对所有类别的平均样本进行迭代运算得到第一训练样本集的分类字典;D、将第二训练样本集中的每个训练样本在分类字典下分解得到一个训练稀疏系数向量;E、将得到的所有训练稀疏系数向量级联得到训练矩阵;F、根据第二训练样本集中的每个训练样本的类别确定所述训练矩阵中每个列向量的类别标签,并保存训练矩阵中每个列向量对应的类别标签,即完成对数据的分类整合。与现有技术相比 ...
【技术保护点】
1.一种优化搜索引擎多索引的查询方法,其特征在于:包括数据存储,数据分表,数据检索三部分;具体步骤为:A、通过在流中源源不断的获取数据,并针对数据特有的结构进行分索引规则匹配.完成数据的分索引操作;B、调用方发起检索数据请求,经过特殊处理以及规则匹配对所需数据进行分索引同时请求;C、对请求得到的数据进行分类整合,然后返回给调用方。
【技术特征摘要】
1.一种优化搜索引擎多索引的查询方法,其特征在于:包括数据存储,数据分表,数据检索三部分;具体步骤为:A、通过在流中源源不断的获取数据,并针对数据特有的结构进行分索引规则匹配.完成数据的分索引操作;B、调用方发起检索数据请求,经过特殊处理以及规则匹配对所需数据进行分索引同时请求;C、对请求得到的数据进行分类整合,然后返回给调用方。2.根据权利要求1所述的一种优化搜索引擎多索引的查询方法,其特征在于:所述步骤C中数据分类整合方法包括以下步骤:A、识别数据库中每个训练样本的类别;B、在预设样本数据库中分别选...
【专利技术属性】
技术研发人员:吴少东,闵早华,张禄宇,
申请(专利权)人:吉旗成都科技有限公司,
类型:发明
国别省市:四川,51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。