一种基于区块链的文本比对方法及装置制造方法及图纸

技术编号:23766263 阅读:16 留言:0更新日期:2020-04-11 19:59
本申请实施例公开了一种基于区块链的文本比对方法,包括:当监测到第一应用平台发布待验证文本数据,基于待验证文本数据的第一分片值对待验证文本数据进行拆分,得到至少一个第一分片文本,获取每个第一分片文本的分片哈希值;将每个第一分片文本的分片哈希值进行拼接,得到待验证文本数据的验证哈希值;从区块链中获取与第二应用平台相关联的多个文本发布区块,根据多个文本发布区块得到第二应用平台对应的权属哈希集合,权属哈希集合包括多个权属哈希值;根据多个权属哈希值分别与验证哈希值的相似度,确定待验证文本数据的侵权鉴定结果。采用本申请,可以提高文本比对的效率。

A text comparison method and device based on blockchain

【技术实现步骤摘要】
一种基于区块链的文本比对方法及装置
本申请涉及区块链
,尤其涉及一种基于区块链的文本比对方法及装置。
技术介绍
随着互联网的发展,通过互联网进行传播的电子文本数据越来越多,用于传播电子文本数据的应用平台也更加多样化,可以说,几乎各种类型的电子文本数据都可以在互联网中获取到相关的数据,如实验报告、论文、电子小说、影视分析等等。然而由于电子文本数据的抄袭十分方便,几乎零成本,且难以获取抄袭痕迹,使得计算机网络中的抄袭现象盛行,因此,对于应用平台来说,保障本应用平台中所发布的文本数据不被盗用也就十分重要,而对于电子文本数据来说,一般电子文本数据的文本长度可能会较长,如果一一比对该电子文本数据与其他电子文本数据,以得到其他电子文本数据与该电子文本数据间的相似度,进而判断其他电子文本数据是否侵权,这个过程需要很大的工作量,耗费资源,使得文本数据的侵权判定过程效率较低。
技术实现思路
本申请实施例提供了一种基于区块链的文本比对方法和装置,可以提高文本比对的效率。本申请实施例第一方面提供了一种基于区块链的文本比对方法,包括:当监测到第一应用平台发布待验证文本数据,基于所述待验证文本数据的第一分片值对所述待验证文本数据进行拆分,得到至少一个第一分片文本,获取每个第一分片文本的分片哈希值;将所述每个第一分片文本的分片哈希值进行拼接,得到所述待验证文本数据的验证哈希值;从区块链中获取与第二应用平台相关联的多个文本发布区块,根据所述多个文本发布区块得到所述第二应用平台对应的权属哈希集合,所述权属哈希集合包括多个权属哈希值;所述权属哈希值是通过将所述第二应用平台中的文本数据对应的分片哈希值进行拼接得到;所述文本数据对应的分片哈希值是指所述文本数据分片后得到的第二分片文本对应的哈希值;根据所述多个权属哈希值分别与所述验证哈希值的相似度,确定所述待验证文本数据的侵权鉴定结果。其中,所述多个权属哈希值包括第一权属哈希值;所述方法还包括:获取第二应用平台的所述文本数据及所述文本数据的第二分片值;根据所述第二分片值将所述文本数据进行拆分,得到至少一个第二分片文本,获取每个第二分片文本的分片哈希值;将所述每个第二分片文本的分片哈希值进行拼接,得到所述文本数据的第一权属哈希值,根据所述第一权属哈希值生成所述文本发布区块,将所述文本发布区块加入所述区块链中。其中,所述方法还包括:基于压缩映射算法对所述每个第一分片文本的分片哈希值进行压缩,得到所述每个第一分片文本的压缩哈希值;所述将所述每个第一分片文本的分片哈希值进行拼接,得到所述待验证文本数据的验证哈希值,包括:基于所述每个第一分片文本在所述待验证文本数据中的相对位置,将所述每个第一分片文本的压缩哈希值依次进行拼接,得到所述待验证文本数据的验证哈希值。其中,所述基于所述待验证文本数据的第一分片值对所述待验证文本数据进行拆分,得到至少一个第一分片文本,包括:通过弱哈希算法得到所述待验证文本数据在滑动窗口中的字符串对应的弱哈希值,基于所述第一分片值对所述弱哈希值取余;若对所述弱哈希值取余的结果等于指定分片值,则在所述待验证文本数据中处于所述滑动窗口中的最后一个字符后进行拆分,得到一个第一分片文本,将所述滑动窗口滑动到拆分位置之后,继续通过所述弱哈希算法获取所述待验证文本数据在滑动后的滑动窗口中字符串对应的弱哈希值,直至所述待验证文本数据的最后一个字符位于所述滑动后的滑动窗口中,得到所述待验证文本数据的至少一个第一分片文本;若对所述弱哈希值取余的结果不等于指定分片值,则将所述滑动窗口沿所述待验证文本数据滑动一个字符,继续通过所述弱哈希算法获取所述待验证文本数据在滑动后的滑动窗口中字符串对应的弱哈希值,直至所述待验证文本数据的最后一个字符位于所述滑动后的滑动窗口中,得到所述待验证文本数据的至少一个第一分片文本。其中,所述根据所述第一权属哈希值生成所述文本发布区块,将所述文本发布区块加入所述区块链中,包括:根据所述第一权属哈希值、所述第一权属哈希值对应的文本数据的标识及所述第二应用平台的平台标识生成所述文本发布区块,将所述文本发布区块广播至所述区块链中的共识节点,若所述共识节点针对所述文本发布区块共识通过,则将所述文本发布区块添加到所述区块链中。其中,所述根据所述多个权属哈希值分别与所述验证哈希值的相似度,确定所述待验证文本数据的侵权鉴定结果,包括:获取所述多个权属哈希值分别与所述验证哈希值的相似度,若所述多个权属哈希值中存在与所述验证哈希值的相似度大于侵权相似值的第二权属哈希值,则确定所述待验证文本数据的侵权鉴定结果为数据侵权结果。其中,所述方法还包括:若确定所述待验证文本数据的侵权鉴定结果为数据侵权结果,则从所述区块链中获取与所述第二权属哈希值及所述第二应用平台相关联的文本发布区块,作为侵权文本发布区块;从所述侵权文本发布区块中获取所述第二权属哈希值对应的文本数据的标识,将所述第二权属哈希值对应的文本数据确定为对照文本数据;向所述第一应用平台发送文本侵权通知,所述文本侵权通知包括所述对照文本数据、所述第二权属哈希值、所述第二权属哈希值与所述验证哈希值的相似度及所述待验证文本数据,以使所述第一应用平台基于所述文本侵权通知删除所述待验证文本数据。其中,所述方法还包括:根据所述对照文本数据的标识、所述第二权属哈希值、所述第二权属哈希值与所述验证哈希值的相似度及所述待验证文本数据生成侵权区块,将所述侵权区块广播至所述区块链中的共识节点,若所述共识节点对所述侵权区块共识通过,则将所述侵权区块上传到所述区块链中;在向所述第一应用平台发送所述文本侵权通知并经过指定时间长度后,从所述第一应用平台中查找所述待验证文本数据;若在所述第一应用平台中查找出所述待验证文本数据,则向侵权管理部门提交侵权证明,所述侵权证明包括所述侵权区块在所述区块链中的地址。本申请实施例第二方面提供了一种基于区块链的文本比对装置,所述装置包括:第一分片模块,用于当监测到第一应用平台发布待验证文本数据,基于所述待验证文本数据的第一分片值对所述待验证文本数据进行拆分,得到至少一个第一分片文本;第一获取模块,用于获取每个第一分片文本的分片哈希值;第一拼接模块,用于将所述每个第一分片文本的分片哈希值进行拼接,得到所述待验证文本数据的验证哈希值;第一查找模块,用于从区块链中获取与第二应用平台相关联的多个文本发布区块,根据所述多个文本发布区块得到所述第二应用平台对应的权属哈希集合,所述权属哈希集合包括多个权属哈希值;所述权属哈希值是通过将所述第二应用平台中的文本数据对应的分片哈希值进行拼接得到;所述文本数据对应的分片哈希值是指所述文本数据分片后得到的第二分片文本对应的哈希值;确定模块,用于根据所述多个权属哈希值分别与所述验证哈希值的相似度,确定所述待验证文本数据的侵权鉴定结果。其中,所述多个本文档来自技高网...

【技术保护点】
1.一种基于区块链的文本比对方法,其特征在于,所述方法包括:/n当监测到第一应用平台发布待验证文本数据,基于所述待验证文本数据的第一分片值对所述待验证文本数据进行拆分,得到至少一个第一分片文本,获取每个第一分片文本的分片哈希值;/n将所述每个第一分片文本的分片哈希值进行拼接,得到所述待验证文本数据的验证哈希值;/n从区块链中获取与第二应用平台相关联的多个文本发布区块,根据所述多个文本发布区块得到所述第二应用平台对应的权属哈希集合,所述权属哈希集合包括多个权属哈希值;所述权属哈希值是通过将所述第二应用平台中的文本数据对应的分片哈希值进行拼接得到;所述文本数据对应的分片哈希值是指所述文本数据分片后得到的第二分片文本对应的哈希值;/n根据所述多个权属哈希值分别与所述验证哈希值的相似度,确定所述待验证文本数据的侵权鉴定结果。/n

【技术特征摘要】
1.一种基于区块链的文本比对方法,其特征在于,所述方法包括:
当监测到第一应用平台发布待验证文本数据,基于所述待验证文本数据的第一分片值对所述待验证文本数据进行拆分,得到至少一个第一分片文本,获取每个第一分片文本的分片哈希值;
将所述每个第一分片文本的分片哈希值进行拼接,得到所述待验证文本数据的验证哈希值;
从区块链中获取与第二应用平台相关联的多个文本发布区块,根据所述多个文本发布区块得到所述第二应用平台对应的权属哈希集合,所述权属哈希集合包括多个权属哈希值;所述权属哈希值是通过将所述第二应用平台中的文本数据对应的分片哈希值进行拼接得到;所述文本数据对应的分片哈希值是指所述文本数据分片后得到的第二分片文本对应的哈希值;
根据所述多个权属哈希值分别与所述验证哈希值的相似度,确定所述待验证文本数据的侵权鉴定结果。


2.如权利要求1所述的方法,其特征在于,所述多个权属哈希值包括第一权属哈希值;所述方法还包括:
获取第二应用平台的所述文本数据及所述文本数据的第二分片值;
根据所述第二分片值将所述文本数据进行拆分,得到至少一个第二分片文本,获取每个第二分片文本的分片哈希值;
将所述每个第二分片文本的分片哈希值进行拼接,得到所述文本数据的第一权属哈希值,根据所述第一权属哈希值生成所述文本发布区块,将所述文本发布区块加入所述区块链中。


3.如权利要求1所述的方法,其特征在于,所述方法还包括:
基于压缩映射算法对所述每个第一分片文本的分片哈希值进行压缩,得到所述每个第一分片文本的压缩哈希值;
所述将所述每个第一分片文本的分片哈希值进行拼接,得到所述待验证文本数据的验证哈希值,包括:
基于所述每个第一分片文本在所述待验证文本数据中的相对位置,将所述每个第一分片文本的压缩哈希值依次进行拼接,得到所述待验证文本数据的验证哈希值。


4.如权利要求1所述的方法,其特征在于,所述基于所述待验证文本数据的第一分片值对所述待验证文本数据进行拆分,得到至少一个第一分片文本,包括:
通过弱哈希算法得到所述待验证文本数据在滑动窗口中的字符串对应的弱哈希值,基于所述第一分片值对所述弱哈希值取余;
若对所述弱哈希值取余的结果等于指定分片值,则在所述待验证文本数据中处于所述滑动窗口中的最后一个字符后进行拆分,得到一个第一分片文本,将所述滑动窗口滑动到拆分位置之后,继续通过所述弱哈希算法获取所述待验证文本数据在滑动后的滑动窗口中字符串对应的弱哈希值,直至所述待验证文本数据的最后一个字符位于所述滑动后的滑动窗口中,得到所述待验证文本数据的至少一个第一分片文本;
若对所述弱哈希值取余的结果不等于指定分片值,则将所述滑动窗口沿所述待验证文本数据滑动一个字符,继续通过所述弱哈希算法获取所述待验证文本数据在滑动后的滑动窗口中字符串对应的弱哈希值,直至所述待验证文本数据的最后一个字符位于所述滑...

【专利技术属性】
技术研发人员:蔡弋戈王乐庆秦青杨晨李琴
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1