一种基于区块链的非原文数据特征查验的系统和方法技术方案

技术编号:33811562 阅读:10 留言:0更新日期:2022-06-16 10:21
本发明专利技术涉及数据合规查验技术领域,具体公开了一种基于区块链的非原文数据特征查验的系统和方法,包括设于本地部署数据特征查验终端底层的带有双维度拆分规则的智能合约,查验方法为结合智能合约对用户输入数据和本地存储的原始数据进行双维度规则拆分,并将拆分后所转换的哈希值进行对比,解决了传统的数据特征查验方法因数据需要出库,被核查的原文数据和被对比的原文数据都需要储存到固定系统平台,容易导致数据隐私泄露的问题。容易导致数据隐私泄露的问题。容易导致数据隐私泄露的问题。

【技术实现步骤摘要】
一种基于区块链的非原文数据特征查验的系统和方法


[0001]本申请涉及数据合规查验
,具体公开了一种基于区块链的非原文数据特征查验的系统和方法。

技术介绍

[0002]目前数据内容相似度机器查验主要通过2种方式实现:
[0003]其一是利用传统软件进行特征查验,即为特征查验数据开发软件的应用,然后把所有需要对比的原文数据存储到软件里面,利用计算机程序进行逐一对比,返回查验对比结果;
[0004]另一方法为:按照数据集内数据量进行分片区的哈希特征比对计算方法实现数据重复性查验。
[0005]主要有以下缺点:
[0006]传统的数据特征查验,数据都需要出库,被核查的原文数据和被对比的原文数据都需要储存到固定系统平台,相较于直接在本地部署数据特征查验终端上进行数据的查验,数据安全和隐私泄露风险很高。
[0007]按照数据集内数据量进行分片区的特征哈希比对,在数据恶意变更篡改的定位分析上以及数据单条修饰后的重复校验上基本不具备实用性,因为一旦数据处理者对每条数据都插入了修饰单元,该种比对方法完全失效。
[0008]因此,专利技术人有鉴于此,提供了一种基于区块链的非原文数据特征查验的系统和方法,以便解决上述问题。

技术实现思路

[0009]本专利技术的目的在于解决传统的数据特征查验方法因数据需要出库,被核查的原文数据和被对比的原文数据都需要储存到固定系统平台,容易导致数据隐私泄露的问题。
[0010]为了达到上述目的,本专利技术的基础方案提供一种基于区块链的非原文数据特征查验系统,包括设于本地部署数据特征查验终端底层的带有双维度拆分规则的智能合约,双维度拆分规则包括依次执行的根据数据字段进行的单条数据拆分和对单条数据进行拆分的数据颗粒拆分。
[0011]进一步,所述依照双维度拆分规则进行拆分的数据子集需按照拆分顺序进行编号,不属于同一个子集内的数据重新依次编号。
[0012]本专利技术的基础方案还提供一种基于区块链的非原文数据特征查验系统的查验方法,包括如下步骤:
[0013]步骤S001:本地部署数据特征查验终端接收用户输入数据生成数据特征审查指令,并由系统调用智能合约接口发生数据内容拆分指令;
[0014]步骤S002:数据内容拆分指令将控制特征查验系统对用户输入数据进行双维度规则拆分,并对拆分的双维度子集进行规则编号并生成与数据拆分编号绑定的哈希子集;
[0015]步骤S003:生成的特征哈希子集与终端内本地存储的特征哈希池进行相同哈希查验,同时可以与由终端上传至特征哈希指纹库的历史哈希进行对比,并将生产的特征哈希集写入区块链,作为被对比特征哈希指纹库。
[0016]进一步,还包括数据重复查验,数据重复查验时,被查验的数据集需按照双维度拆分规则进行拆分,且需分段生成哈希值。
[0017]进一步,所述数据重复查验包括对内重复查验、对外重复查验以及定位数据篡改位置查验。
[0018]进一步,所述对内重复查验包括数据重复情况查验、敏感词查验和数据空值查验,敏感词查验判方法为对特征哈希子集与特征哈希池的内置敏感词哈希计算结果查验,数据内容空值查验判定方法为特征哈希子集与特征哈希池的长度查验。
[0019]进一步,所述对外重复查验的过程为:将待查验的数据字段分区哈希集与特征哈希池内哈希集合进行查验,将相同的哈希所在哈希集调取出来并进行相似数据源确认。
[0020]进一步,所述定位数据数据篡改位置查验的过程为:将待查验的数据字段分区哈希集内的子集哈希和历史同样算法得到的哈希集进行对比,将不同的异常的哈希子集进行编号并标记,利用双维度拆分规则找到相应编号子集。
[0021]与现有技术相比,本专利技术的有益效果为:
[0022]1.本专利技术将原始数据存储进本地部署了数据特征查验的终端内,用户可直接在终端上完成查验步骤,在数据不出库的情况下,仅使用散列算法即可实现高效、精确地实现大规模结构化数据的特征查验,解决了传统的数据特征查验方法因数据需要出库,被核查的原文数据和被对比的原文数据都需要储存到固定系统平台,容易导致数据隐私泄露的问题。
[0023]2.本专利技术通过双维度拆分规则对用户数据数据和原始数据进行双维度拆分,能对每条数据进行高精确的查验。
[0024]3.本专利技术在对用户输入的数据进行了查验后,会将新数据所产生的的特征哈希集写入区块链,作为被对比特征哈希指纹库,丰富本地特征哈希指纹库。
[0025]4.本专利技术通过双维度拆分规则对数据进行拆分后,会对数据进行标号处理,并与哈希子集进行绑定,可以便于后续数据查验时通过编号对数据进行快速定位。
[0026]与现有技术相比,本专利技术在数据不出库的情况下,仅使用散列算法即可实现高效、精确地实现大规模结构化数据的特征查验,且首创提供了双维度拆分方法在数据查验上的应用,解决了传统的数据特征查验方法因数据需要出库,被核查的原文数据和被对比的原文数据都需要储存到固定系统平台,容易导致数据隐私泄露的问题。
附图说明
[0027]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0028]图1示出了本申请实施例提出的一种一种基于区块链的非原文数据特征查验的系统和方法的架构示意图;
[0029]图2示出了本申请实施例提出的一种一种基于区块链的非原文数据特征查验的系统和方法的流程示意图;
[0030]图3示出了本申请实施例提出的一种一种基于区块链的非原文数据特征查验的系统和方法的流程示意图;
[0031]图4示出了本申请实施例提出的一种一种基于区块链的非原文数据特征查验的系统和方法的流程示意图;
[0032]图5示出了本申请实施例提出的一种一种基于区块链的非原文数据特征查验的系统和方法的流程示意图;
[0033]图6示出了本申请实施例提出的一种一种基于区块链的非原文数据特征查验的系统和方法的标识图。
具体实施方式
[0034]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0035]下面通过具体实施方式进一步详细的说明:
[0036]一种基于区块链的非原文数据特征查验系统,如图1和图2所示,本系统和方法应用于各个企业本地部署数据特征查验终端,终端内底层区块链部署带有数据内容双维度规则拆分的智能合约,通过对数据内容进行双维度规则拆分,再将拆分后数据哈希值写入区块链,当用于在终端输入查验数据时,当用户输入的数据后,输入的数据将进行双维度规则拆分并生成哈希子集,通过对比原始数据与本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于区块链的非原文数据特征查验系统,其特征在于,包括设于本地部署数据特征查验终端底层的带有双维度拆分规则的智能合约,双维度拆分规则包括依次执行的根据数据字段进行的单条数据拆分和对单条数据进行拆分的数据颗粒拆分。2.根据权利要求1所述的一种基于区块链的非原文数据特征查验系统,其特征在于,依照双维度拆分规则进行拆分的数据子集需按照拆分顺序进行编号,不属于同一个子集内的数据重新依次编号。3.一种基于权利要求1或2所述的区块链的非原文数据特征查验系统的查验方法,其特征在于,包括如下步骤:步骤S001:本地部署数据特征查验终端接收用户输入数据生成数据特征审查指令,并由系统调用智能合约接口发生数据内容拆分指令;步骤S002:数据内容拆分指令将控制特征查验系统对用户输入数据进行双维度规则拆分,并对拆分的双维度子集进行规则编号并生成与数据拆分编号绑定的哈希子集;步骤S003:生成的特征哈希子集与终端内本地存储的特征哈希池进行相同哈希查验,同时可以与由终端上传至特征哈希指纹库的历史哈希进行对比,并将生产的特征哈希集写入区块链,作为被对比特征哈希指纹库。4.根据权利要求3所述的区块链的非原文数据特征查验系统的查验方法...

【专利技术属性】
技术研发人员:邵羽徐思思王宇唐瑞琮
申请(专利权)人:重庆市先进区块链研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1