一种提高检索效率的区块链数据检索方法技术

技术编号:34976970 阅读:20 留言:0更新日期:2022-09-21 14:18
本申请公开了一种提高检索效率的区块链数据检索方法,涉及区块链技术领域,该方法通过大量的历史检索记录构建反映用户使用习惯的特征模型,并构建基于特征模型的索引关系列表,索引关系列表的各个数据分组中关联了多维业务数据,且每个数据分组具有对应的特征索引数组,所以通过数据特征检索定位到满足条件的数据分组就可以关联到该分组下所有多维业务数据,检索条件可以直接通过索引关系列表实现基于数据特征的检索,而无需在数据内容中执行检索匹配,这样可以大大节约检索时间,提高检索效率。索效率。索效率。

【技术实现步骤摘要】
一种提高检索效率的区块链数据检索方法


[0001]本申请涉及区块链
,尤其是一种提高检索效率的区块链数据检索方法。

技术介绍

[0002]随着云存储、云计算的发展,数据存储的规模以及存储的复杂度逐步提高,对数据存储的保密性、安全性要求也越来越高。区块链技术能够实现数据客观记录、数据隐私保护、数据防篡改等特性,是一种高质量的数据安全存储方案。在众多应用领域,区块链存储正在逐步替代传统中心化数据存储模式,从而提升数据存储安全。其中,像地理信息、智能城市、制造模型设计等应用领域,在保障数据安全同时,支持高效的多维数据上链及多维数据检索诉求愈专利技术确。
[0003]基于传统关系存储模式,多维数据存储设计方案更加简单和直接。区块链因为采用了多方共识策略及复杂的密码学机制,要实现安全与性能的双优,需要更精准、细化的存储和检索管理策略。基于区块链如何实现多维数据的高效存储、检索,是区块链面向海量存储应用的研究重点之一。
[0004]现有区块链主要支持K

V存储模式。K分为普通索引和复合键索引,复合键索引拥有按序的范围查询能力。普通索引方式需要逐一检索,效率低下。基于现有复合键索引方案中,多维数据被设计为复合键和数据两部分。选取多维数据的某些特征按固定顺序拼接组成复合键K,多维数据加密后作为V值,以K

V模式插入区块链账本。但是数据检索时候,也只能按该固定顺序来执行特征检索,比如二维数据拥有二维特征A和B,那么复合键K将组装为A和B,检索操作时只能先检索满足A条件的数据对象集,而不能直接检索满足B特征的数据对象集,由于需要重复轮询,且每次都要遍历所有数据进行特征比对,所以常规的复合键查询机制的检索效率较低。

技术实现思路

[0005]本申请人针对上述问题及技术需求,提出了一种提高检索效率的区块链数据检索方法,本申请的技术方案如下:
[0006]一种提高检索效率的区块链数据检索方法,该方法包括:
[0007]根据历史检索记录构建特征模型,特征模型包含在历史检索记录中作为检索条件的若干个数据特征;
[0008]根据特征模型构建索引关系列表并存储在区块链账本中,索引关系列表包含若干个数据分组、且每个数据分组具有对应的特征索引数组,每个数据分组中包括若干条多维业务数据,每个特征索引数组中包含特征模型中的若干个数据特征,且一个数据分组中的每条多维业务数据的数据内容包含对应的特征索引数组中的所有数据特征;同一个数据分组中的若干条多维业务数据具有特征关联性,不同数据分组中的多维业务数据不具有特征关联性;
[0009]利用索引关系列表提供数据检索功能,基于客户端发送的检索请求包含的数据特
征所在的特征索引数组对应的数据分组得到检索结果。
[0010]其进一步的技术方案为,该方法还包括:
[0011]每隔预定时间间隔,根据最近的N条历史检索记录更新特征模型,并利用更新后的特征模型更新索引关系列表。
[0012]其进一步的技术方案为,特征模型中包含的数据特征是基于历史检索记录确定的用于反映检索习惯趋势的数据特征。
[0013]其进一步的技术方案为,区块链账本中存储有至少两个不同的用户对应的索引关系列表,每个用户对应的索引关系列表由用户的特征模型构建得到,每个用户的特征模型由用户的历史检索记录构建得到,不同用户的特征模型用于反映不同用户的检索习惯趋势;则在利用区块链账本中的索引关系列表提供数据检索功能时,利用发送检索请求的用户所对应的索引关系列表响应检索请求。
[0014]其进一步的技术方案为,根据历史检索记录构建特征模型,包括:
[0015]汇总所有历史检索记录中出现的作为检索条件的所有数据特征,并根据每个数据特征所在的历史检索记录确定数据特征的影响值,数据特征的影响值越高,所表征的检索习惯趋势的偏向性越高;
[0016]选取影响值最大的K个数据特征构建得到特征模型,影响值最大的K个数据特征是最能反映检索习惯趋势的数据特征。
[0017]其进一步的技术方案为,根据每个数据特征所在的历史检索记录确定数据特征的影响值,包括:
[0018]根据每个数据特征在历史检索记录中出现的总次数以及包含数据特征的历史检索记录的产生时间确定各个数据特征的影响值;
[0019]其中,数据特征在历史检索记录中出现的总次数越多、包含数据特征的历史检索记录的产生时间越接近当前时刻,数据特征的影响值越大。
[0020]其进一步的技术方案为,确定各个数据特征的影响值,包括按如下公式确定每个数据特征的影响值S为:
[0021][0022]其中,A、A0均为常量系数,用于构建特征模型的所有历史检索记录的产生时间覆盖的时间区间为[T
B
,T
E
],T
i
是包含数据特征的第i条历史检索记录的产生时间,集合I是包含数据特征的所有历史检索记录构成的集合。
[0023]其进一步的技术方案为,利用索引关系列表提供数据检索功能,包括:
[0024]获取客户端输入的检索请求,检索请求包括典型特征和非典型特征,典型特征是包含在特征模型中的数据特征,非典型特征是未包含在特征模型中的数据特征;
[0025]获取包含典型特征的特征索引数组对应的所有的数据分组作为候选分组;
[0026]利用非典型特征对所有候选分组包含的多维业务数据进行逐一检索比对,最终筛选出检索结果。
[0027]其进一步的技术方案为,该方法还包括:
[0028]将与检索结果具有使用相关性的数据分组包含的多维业务数据主动推送给发送检索请求的客户端。
[0029]其进一步的技术方案为,根据特征模型构建索引关系列表,包括:
[0030]以特征模型中的数据特征为行、区块链账本中的所有多维业务数据为列构建得到特征匹配矩阵,当第j列对应的多维业务数据的数据内容包含第i行的数据特征时,特征匹配矩阵中第i行第j列的元素为1;当第j列对应的多维业务数据的数据内容不包含第i行的数据特征时,特征匹配矩阵中第i行第j列的元素为0;
[0031]采用局部敏感哈希算法基于特征匹配矩阵计算得到各条多维业务数据的相似度,根据各条多维业务数据的相似度划分得到若干个数据分组,每个数据分组对应一个相似度范围且不同数据分组的相似度范围互不重合,每个数据分组包含相似度落在对应的相似度范围内的若干条多维业务数据;确定相似度范围的差异性小于差异性阈值的数据分组之间具有使用相关性。
[0032]本申请的有益技术效果是:
[0033]本申请公开了一种提高检索效率的区块链数据检索方法,该方法通过大量的历史检索记录构建反映用户使用习惯的特征模型,并构建基于特征模型的索引关系列表,索引关系列表的各个分组中关联了多维业务数据,所以通过数据特征检索定位到满足条件的分组就可以关联到该分组下所有多维业务数据,检索条件可以直接通过索引关系列表实现基于数据特征的检索,而无需在数据内容中执行检索本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种提高检索效率的区块链数据检索方法,其特征在于,所述方法包括:根据历史检索记录构建特征模型,所述特征模型包含在历史检索记录中作为检索条件的若干个数据特征;根据所述特征模型构建索引关系列表并存储在区块链账本中,所述索引关系列表包含若干个数据分组、且每个数据分组具有对应的特征索引数组,每个数据分组中包括若干条多维业务数据,每个特征索引数组中包含所述特征模型中的若干个数据特征,且一个数据分组中的每条多维业务数据的数据内容包含对应的特征索引数组中的所有数据特征;同一个数据分组中的若干条多维业务数据具有特征关联性,不同数据分组中的多维业务数据不具有特征关联性;利用所述索引关系列表提供数据检索功能,基于客户端发送的检索请求包含的数据特征所在的特征索引数组对应的数据分组得到检索结果。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:每隔预定时间间隔,根据最近的N条历史检索记录更新所述特征模型,并利用更新后的特征模型更新所述索引关系列表。3.根据权利要求1所述的方法,其特征在于,所述特征模型中包含的数据特征是基于历史检索记录确定的用于反映检索习惯趋势的数据特征。4.根据权利要求3所述的方法,其特征在于,所述区块链账本中存储有至少两个不同的用户对应的索引关系列表,每个用户对应的索引关系列表由所述用户的特征模型构建得到,每个用户的特征模型由所述用户的历史检索记录构建得到,不同用户的特征模型用于反映不同用户的检索习惯趋势;则在利用区块链账本中的索引关系列表提供数据检索功能时,利用发送所述检索请求的用户所对应的索引关系列表响应所述检索请求。5.根据权利要求3所述的方法,其特征在于,所述根据历史检索记录构建特征模型,包括:汇总所有历史检索记录中出现的作为检索条件的所有数据特征,并根据每个数据特征所在的历史检索记录确定所述数据特征的影响值,数据特征的影响值越高,所表征的检索习惯趋势的偏向性越高;选取影响值最大的K个数据特征构建得到所述特征模型,影响值最大的K个数据特征是最能反映检索习惯趋势的数据特征。6.根据权利要求5所述的方法,其特征在于,所述根据每个数据特征所在的历史检索记录确定所述数据特征的影响值,包括:根据每个数据特征在历史检索记录中出现的总次数以及包含所...

【专利技术属性】
技术研发人员:程成赵峰刘子祥陈鲁愚吴烽王祥
申请(专利权)人:深海技术科学太湖实验室杭州烽顺科技信息服务有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1