一种基于区块链的数据可信确权方法和装置制造方法及图纸

技术编号:39594605 阅读:8 留言:0更新日期:2023-12-03 19:49
本发明专利技术提供一种基于区块链的数据可信确权方法和装置,通过基于每一已生成的文本类非同质化通证的原始数据构建状态自动机,对待确权数据和每个文本类非同质化通证的状态自动机进行匹配时,将当前文本块与当前匹配节点的后缀集合中长度为当前文本块长度的候选后缀进行匹配,并将匹配的候选后缀对应的节点作为下一匹配节点与下一文本块进行匹配,得到待确权数据与各文本类非同质化通证的匹配结果,并确定其确权结果;其中为各个节点设置的模糊转移指针可以在匹配失败时快速确定下一匹配节点,为各个节点设置包含长度小于等于预设滑动窗口长度的候选后缀的后缀集合,更快速地实现字符串的模糊匹配,实现更精准且时间复杂度接近线性的数据快速确权

【技术实现步骤摘要】
一种基于区块链的数据可信确权方法和装置


[0001]本专利技术涉及数据确权
,尤其涉及一种基于区块链的数据可信确权方法和装置


技术介绍

[0002]数据作为基础性战略资源,可以被买卖

转让和使用

然而,一旦某份数据在网络上发布,其他人就能转载和复制,导致无法追溯数据的最初作者,从而引发所有权不明确的问题

可见,数据的归属至关重要

因此,要将数据作为数字资产,最关键的是对数据进行确权,即确定某种数据的所有权或归属权属于谁

通过数据确权,可以促进数据整合,加速数据共享和流通,推动数据产业的迅速发展

[0003]虽然基于互联网的信息网络方便了数据的共享,但无法实现数据的确权和记录数据价值的流转,因此无法将互联网上的数据视为资产

随着这一矛盾的加剧,区块链技术的出现有效解决了数据确权的问题

上传至区块链网络生成的每一份数据都可以定义其所有权关系,只有经过数据确权后,为其生成非同质化通证后,数据才真正具备价值,并且能够实现数据资产的流转和交易

[0004]然而,现有的确权方案通常通过将待确权数据与数据库中已有的数据进行一一比对的方式进行数据查重,或者在原始数据基础上生成数字指纹(例如哈希值)利用数字指纹进行数据匹配,存在效率较低的问题,而随着当今几乎所有
对快速解决方案的需求不断增长,毫无疑问,与现有的实现相比,确权效率正成为一个主要的制约因素

同时,针对一些易修改的文档内容,上述方式也很难实现精准查重,导致确权结果不准确


技术实现思路

[0005]本专利技术提供一种基于区块链的数据可信确权方法和装置,用以解决现有技术中数据确权效率较低且确权结果准确性欠佳的缺陷

[0006]本专利技术提供一种基于区块链的数据可信确权方法,包括:基于区块链节点中每一已生成的文本类非同质化通证的原始数据,构建每一已生成的文本类非同质化通证的状态自动机;将当前已生成的文本类非同质化通证的状态自动机作为待匹配自动机,对待确权数据与所述待匹配自动机进行逐文本块匹配,得到所述待确权数据与所述当前已生成的文本类非同质化通证的匹配结果;其中,在对所述待确权数据的当前文本块与所述待匹配自动机的当前匹配节点进行匹配时,将所述当前文本块与所述当前匹配节点的后缀集合中长度为当前文本块长度的候选后缀进行匹配,并将匹配的候选后缀对应的节点作为下一匹配节点与所述待确权数据的下一文本块进行匹配;所述当前文本块的长度小于等于滑动窗口长度,所述后缀集合中包含长度小于等于滑动窗口长度的候选后缀;基于所述待确权数据与每一已生成的文本类非同质化通证的匹配结果,确定所述待确权数据的确权结果

[0007]根据本专利技术提供的一种基于区块链的数据可信确权方法,所述将所述当前文本块与所述当前匹配节点的后缀集合中长度为当前文本块长度的候选后缀进行匹配,并将匹配的候选后缀对应的节点作为下一匹配节点与所述待确权数据的下一文本块进行匹配,具体包括:分别确定所述当前文本块与所述当前匹配节点的后缀集合中每一长度为当前文本块长度的候选后缀之间的相似度,判断是否存在匹配的候选后缀;若存在匹配的候选后缀,则确定所述待匹配自动机中所述匹配的候选后缀对应的节点,并在所述匹配的候选后缀对应的节点为结束节点时,标记所述待确权数据中当前匹配开始位置和当前文本块的结束位置之间的字符串为匹配串,将下一文本块的开始位置作为下一匹配开始位置,将所述待匹配自动机的初始节点作为下一匹配节点;在所述匹配的候选后缀对应的节点不为结束节点时,将所述匹配的候选后缀对应的节点作为下一匹配节点;若不存在匹配的候选后缀,则确定所述当前匹配节点的模糊转移指针指向的节点作为下一匹配节点

[0008]根据本专利技术提供的一种基于区块链的数据可信确权方法,任一已生成的文本类非同质化通证的状态自动机中任一节点的后缀集合是基于如下步骤构建的:从所述任一节点开始对相应状态自动机进行深度优先遍历,基于每一条深度遍历路径上的各个节点对应的字符,获取长度小于等于所述滑动窗口长度的候选后缀;其中,若在深度优先遍历过程中遍历到结束节点时,当前深度遍历路径上的节点数量小于所述滑动窗口长度,则将当前遍历到的结束节点的模糊转移指针指向的节点作为下一遍历节点,直至当前深度遍历路径上的节点数量等于所述滑动窗口长度

[0009]根据本专利技术提供的一种基于区块链的数据可信确权方法,任一已生成的文本类非同质化通证的状态自动机中任一节点的模糊转移指针是基于如下步骤确定的:确定相应状态自动机的初始节点到每一非初始节点的路径上每一节点对应的字符组成的字符串;确定所述初始节点到任一非初始节点的路径上每一节点对应的字符组成的字符串的最长后缀,若所述最长后缀是相应状态自动机的初始节点到任一其他非初始节点的路径上每一节点对应的字符组成的字符串的最长前缀,则将所述任一非初始节点的模糊转移指针指向所述任一其他非初始节点;否则,将所述任一非初始节点的模糊转移指针指向所述初始节点

[0010]根据本专利技术提供的一种基于区块链的数据可信确权方法,所述分别确定所述当前文本块与所述当前匹配节点的后缀集合中每一长度为当前文本块长度的候选后缀之间的相似度,判断是否存在匹配的候选后缀,具体包括:计算所述当前文本块与任一长度为当前文本块长度的候选后缀之间的汉明距离,作为所述当前文本块与所述任一长度为当前文本块长度的候选后缀之间的相似度;基于所述当前文本块对应的相似度阈值,以及所述当前文本块与所述任一长度为当前文本块长度的候选后缀之间的相似度,判断所述当前文本块是否与所述任一长度为当前文本块长度的候选后缀匹配;其中,所述当前文本块对应的相似度阈值是基于所述当前文本块的长度确定的

[0011]根据本专利技术提供的一种基于区块链的数据可信确权方法,所述基于所述当前文本块对应的相似度阈值,以及所述当前文本块与所述任一长度为当前文本块长度的候选后缀之间的相似度,判断所述当前文本块是否与所述任一长度为当前文本块长度的候选后缀匹配,具体包括:若所述当前文本块与所述任一长度为当前文本块长度的候选后缀之间的相似度最高且大于所述当前文本块对应的相似度阈值,则确定所述待确权数据中当前匹配开始位置和当前文本块的结束位置之间的字符串为第一字符串,确定从当前匹配开始位置对应的节点至所述任一长度为当前文本块长度的候选后缀对应的节点经历的路径对应的字符串为第二字符串;确定所述第一字符串与所述第二字符串之间的编辑距离;若所述编辑距离小于验证阈值,则确定所述当前文本块与所述任一长度为当前文本块长度的候选后缀匹配

[0012]根据本专利技术提供的一种基于区块链的数据可信确权方法,所述验证阈值是基于所述第二字符串的长度和所述滑动窗口长度确定的;其中,所述第二字符串的长度越长或所述滑动窗口长度越长,则所述验证阈值越大

本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于区块链的数据可信确权方法,其特征在于,包括:基于区块链节点中每一已生成的文本类非同质化通证的原始数据,构建每一已生成的文本类非同质化通证的状态自动机;将当前已生成的文本类非同质化通证的状态自动机作为待匹配自动机,对待确权数据与所述待匹配自动机进行逐文本块匹配,得到所述待确权数据与所述当前已生成的文本类非同质化通证的匹配结果;其中,在对所述待确权数据的当前文本块与所述待匹配自动机的当前匹配节点进行匹配时,将所述当前文本块与所述当前匹配节点的后缀集合中长度为当前文本块长度的候选后缀进行匹配,并将匹配的候选后缀对应的节点作为下一匹配节点与所述待确权数据的下一文本块进行匹配;所述当前文本块的长度小于等于滑动窗口长度,所述后缀集合中包含长度小于等于滑动窗口长度的候选后缀;基于所述待确权数据与每一已生成的文本类非同质化通证的匹配结果,确定所述待确权数据的确权结果
。2.
根据权利要求1所述的基于区块链的数据可信确权方法,其特征在于,所述将所述当前文本块与所述当前匹配节点的后缀集合中长度为当前文本块长度的候选后缀进行匹配,并将匹配的候选后缀对应的节点作为下一匹配节点与所述待确权数据的下一文本块进行匹配,具体包括:分别确定所述当前文本块与所述当前匹配节点的后缀集合中每一长度为当前文本块长度的候选后缀之间的相似度,判断是否存在匹配的候选后缀;若存在匹配的候选后缀,则确定所述待匹配自动机中所述匹配的候选后缀对应的节点,并在所述匹配的候选后缀对应的节点为结束节点时,标记所述待确权数据中当前匹配开始位置和当前文本块的结束位置之间的字符串为匹配串,将下一文本块的开始位置作为下一匹配开始位置,将所述待匹配自动机的初始节点作为下一匹配节点;在所述匹配的候选后缀对应的节点不为结束节点时,将所述匹配的候选后缀对应的节点作为下一匹配节点;若不存在匹配的候选后缀,则确定所述当前匹配节点的模糊转移指针指向的节点作为下一匹配节点
。3.
根据权利要求2所述的基于区块链的数据可信确权方法,其特征在于,任一已生成的文本类非同质化通证的状态自动机中任一节点的后缀集合是基于如下步骤构建的:从所述任一节点开始对相应状态自动机进行深度优先遍历,基于每一条深度遍历路径上的各个节点对应的字符,获取长度小于等于所述滑动窗口长度的候选后缀;其中,若在深度优先遍历过程中遍历到结束节点时,当前深度遍历路径上的节点数量小于所述滑动窗口长度,则将当前遍历到的结束节点的模糊转移指针指向的节点作为下一遍历节点,直至当前深度遍历路径上的节点数量等于所述滑动窗口长度
。4.
根据权利要求2所述的基于区块链的数据可信确权方法,其特征在于,任一已生成的文本类非同质化通证的状态自动机中任一节点的模糊转移指针是基于如下步骤确定的:确定相应状态自动机的初始节点到每一非初始节点的路径上每一节点对应的字符组成的字符串;确定所述初始节点到任一非初始节点的路径上每一节点对应的字符组成的字符串的最长后缀,若所述最长后缀是相应状态自动机的初始节点到任一其他非初始节点的路径上
每一节点对应的字符组成的字符串的最长前缀,则将所述任一非初始节点的模糊转移指针指向所述任一其他非初始节点;否则,将所述任一非初始节点的模糊转移指针指向所述初始节点
。5.
根据权利要求2所述的基于区块链的数据可信确权方法,其特征在于,所述分别确定所述当前文本块与所述当前匹配节点的后缀集合中每一长度为当前文本块长度的候选后缀之间的相似度,判断是否存在匹配的候选后缀,具体包...

【专利技术属性】
技术研发人员:韩国权高山曹杨谢红韬邹佳董厚泽
申请(专利权)人:中电科大数据研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1