【技术实现步骤摘要】
一种基于区块链的文本比对方法及装置
本申请涉及区块链
,尤其涉及一种基于区块链的文本比对方法及装置。
技术介绍
随着互联网的发展,通过互联网进行传播的电子文本数据越来越多,用于传播电子文本数据的应用平台也更加多样化,可以说,几乎各种类型的电子文本数据都可以在互联网中获取到相关的数据,如实验报告、论文、电子小说、影视分析等等。然而由于电子文本数据的抄袭十分方便,几乎零成本,且难以获取抄袭痕迹,使得计算机网络中的抄袭现象盛行,因此,对于应用平台来说,保障本应用平台中所发布的文本数据不被盗用也就十分重要,而对于电子文本数据来说,一般电子文本数据的文本长度可能会较长,如果一一比对该电子文本数据与其他电子文本数据,以得到其他电子文本数据与该电子文本数据间的相似度,进而判断其他电子文本数据是否侵权,这个过程需要很大的工作量,耗费资源,使得文本数据的侵权判定过程效率较低。
技术实现思路
本申请实施例提供了一种基于区块链的文本比对方法和装置,可以提高文本比对的效率。本申请实施例第一方面提供了一种基于区块链的文本比对方法,包括:当监测到第一应用平台发布待验证文本数据,基于所述待验证文本数据的第一分片值对所述待验证文本数据进行拆分,得到至少一个第一分片文本,获取每个第一分片文本的分片哈希值;将所述每个第一分片文本的分片哈希值进行拼接,得到所述待验证文本数据的验证哈希值;从区块链中获取与第二应用平台相关联的多个文本发布区块,根据所述多个文本发布区块得到所述第二应用平台对应的权属哈希 ...
【技术保护点】
1.一种基于区块链的文本比对方法,其特征在于,所述方法包括:/n当监测到第一应用平台发布待验证文本数据,基于所述待验证文本数据的第一分片值对所述待验证文本数据进行拆分,得到至少一个第一分片文本,获取每个第一分片文本的分片哈希值;/n将所述每个第一分片文本的分片哈希值进行拼接,得到所述待验证文本数据的验证哈希值;/n从区块链中获取与第二应用平台相关联的多个文本发布区块,根据所述多个文本发布区块得到所述第二应用平台对应的权属哈希集合,所述权属哈希集合包括多个权属哈希值;所述权属哈希值是通过将所述第二应用平台中的文本数据对应的分片哈希值进行拼接得到;所述文本数据对应的分片哈希值是指所述文本数据分片后得到的第二分片文本对应的哈希值;/n根据所述多个权属哈希值分别与所述验证哈希值的相似度,确定所述待验证文本数据的侵权鉴定结果。/n
【技术特征摘要】
1.一种基于区块链的文本比对方法,其特征在于,所述方法包括:
当监测到第一应用平台发布待验证文本数据,基于所述待验证文本数据的第一分片值对所述待验证文本数据进行拆分,得到至少一个第一分片文本,获取每个第一分片文本的分片哈希值;
将所述每个第一分片文本的分片哈希值进行拼接,得到所述待验证文本数据的验证哈希值;
从区块链中获取与第二应用平台相关联的多个文本发布区块,根据所述多个文本发布区块得到所述第二应用平台对应的权属哈希集合,所述权属哈希集合包括多个权属哈希值;所述权属哈希值是通过将所述第二应用平台中的文本数据对应的分片哈希值进行拼接得到;所述文本数据对应的分片哈希值是指所述文本数据分片后得到的第二分片文本对应的哈希值;
根据所述多个权属哈希值分别与所述验证哈希值的相似度,确定所述待验证文本数据的侵权鉴定结果。
2.如权利要求1所述的方法,其特征在于,所述多个权属哈希值包括第一权属哈希值;所述方法还包括:
获取第二应用平台的所述文本数据及所述文本数据的第二分片值;
根据所述第二分片值将所述文本数据进行拆分,得到至少一个第二分片文本,获取每个第二分片文本的分片哈希值;
将所述每个第二分片文本的分片哈希值进行拼接,得到所述文本数据的第一权属哈希值,根据所述第一权属哈希值生成所述文本发布区块,将所述文本发布区块加入所述区块链中。
3.如权利要求1所述的方法,其特征在于,所述方法还包括:
基于压缩映射算法对所述每个第一分片文本的分片哈希值进行压缩,得到所述每个第一分片文本的压缩哈希值;
所述将所述每个第一分片文本的分片哈希值进行拼接,得到所述待验证文本数据的验证哈希值,包括:
基于所述每个第一分片文本在所述待验证文本数据中的相对位置,将所述每个第一分片文本的压缩哈希值依次进行拼接,得到所述待验证文本数据的验证哈希值。
4.如权利要求1所述的方法,其特征在于,所述基于所述待验证文本数据的第一分片值对所述待验证文本数据进行拆分,得到至少一个第一分片文本,包括:
通过弱哈希算法得到所述待验证文本数据在滑动窗口中的字符串对应的弱哈希值,基于所述第一分片值对所述弱哈希值取余;
若对所述弱哈希值取余的结果等于指定分片值,则在所述待验证文本数据中处于所述滑动窗口中的最后一个字符后进行拆分,得到一个第一分片文本,将所述滑动窗口滑动到拆分位置之后,继续通过所述弱哈希算法获取所述待验证文本数据在滑动后的滑动窗口中字符串对应的弱哈希值,直至所述待验证文本数据的最后一个字符位于所述滑动后的滑动窗口中,得到所述待验证文本数据的至少一个第一分片文本;
若对所述弱哈希值取余的结果不等于指定分片值,则将所述滑动窗口沿所述待验证文本数据滑动一个字符,继续通过所述弱哈希算法获取所述待验证文本数据在滑动后的滑动窗口中字符串对应的弱哈希值,直至所述待验证文本数据的最后一个字符位于所述滑...
【专利技术属性】
技术研发人员:蔡弋戈,王乐庆,秦青,杨晨,李琴,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。