System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于标识的数据溯源方法、设备及存储介质技术_技高网

一种基于标识的数据溯源方法、设备及存储介质技术

技术编号:40785164 阅读:4 留言:0更新日期:2024-03-28 19:17
本发明专利技术公开了一种基于标识的数据溯源方法、设备及存储介质。本发明专利技术首先将数据的元数据信息储存在资源标识信息表中,资源标识作为资源标识信息表的主键;随后创建标识作为数据的主键,所述标识由资源标识和关联数据拼接组成;之后来源数据标识中的关联数据和目的数据标识中的关联数据具有互相推导的特性;再创建来源数据资源标识和目的数据资源标识的关联关系;最后依据所述标识进行数据溯源。本发明专利技术有效提高了数据溯源的准确性,还明显降低了标注信息的存储需求,同时提高了溯源查询的效率。

【技术实现步骤摘要】

本专利技术属于数据库,更具体地,涉及一种基于标识的数据溯源方法、设备及存储介质


技术介绍

1、在大数据时代,公安部门不仅纵向上汇集了国家、省、市、县等多个层级的数据,还横向上整合了各政务部门和各行业机构的数据。这些数据经过汇集、清洗、转换和加工,形成了一个统一的数据集市,既能纵向支持基层民警的实战工作,又能横向支持各政务部门的业务服务。然而,在数据整合、加工和交换的过程中,由于系统故障、数据格式或文字编码等原因,业务数据可能发生内容上的改变。如果数据使用单位,尤其是政府部门,引用了这些不准确的数据,可能会引发投诉甚至诉讼,后果十分严重。因此,我们经常需要追溯数据的来源,以确定数据的确切含义,并排查数据出错的环节。这一追溯过程至关重要,它能帮助我们准确理解数据,并找出数据改变的原因和责任。

2、目前数据溯源主要采用以下方法:标注法、反向查询法、数据聚类法以及基于图数据库的溯源方法。现有的传统标注溯源方法虽然有效,但却面临着存储空间占用过高的问题。反向查询法在某些场景下无法进行逆向操作,同时逆向语句的复杂性也带来了一定的挑战。数据聚类方式虽然简单,但其准确度却相对较低。图数据库的方式会增加额外的采购、部署和技术学习成本。


技术实现思路

1、针对现有技术的以上缺陷或改进需求,本专利技术提供了一种基于标识的数据溯源方法、设备及存储介质,其目的在于解决现有数据溯源存在的空间占用过高、适用性不强、准确度较低以及成本过高的技术问题。

2、为实现上述目的,第一方面,本专利技术提供了一种基于标识的数据溯源方法,所述方法包括:

3、将数据的元数据信息储存在资源标识信息表中,资源标识作为资源标识信息表的主键;

4、记录来源数据资源标识和目的数据资源标识的映射关系;

5、创建标识作为数据的主键,所述标识由资源标识和关联数据拼接组成;

6、来源数据标识中的关联数据和目的数据标识中的关联数据具有互相推导的特性;

7、依据所述标识进行数据溯源。

8、优选的,先随机生成来源数据标识中的关联数据,且所述关联数据是唯一的,再通过来源数据标识中的关联数据推导出目的数据标识中的关联数据。

9、优选的,若目的数据只具有一个来源数据,则来源数据标识中的关联数据等于目的数据标识中的关联数据。

10、优选的,若目的数据具有两个及以上的来源数据,则采用哈希函数由来源数据标识中的关联数据生成目的数据标识中的关联数据。

11、优选的,建立目的数据标识和对应来源数据标识的映射关系。

12、优选的,将目的数据标识和对应来源数据标识的映射关系存储到数据库中。

13、优选的,随机生成来源数据标识中的关联数据,具体为:采用guid函数、哈希函数和自定义随机函数中至少一种函数生成唯一的关联数据。

14、优选的,所述哈希函数中包括md5函数。

15、优选的,依据所述标识进行数据溯源,具体为:

16、读取待溯源数据的标识;

17、从所述标识中拆分出资源标识和关联数据;

18、基于来源数据资源标识和目的数据资源标识的映射关系,利用待溯源数据的资源标识找到来源数据的资源标识;

19、基于来源数据标识中的关联数据和目的数据标识中的关联数据具有互相推导的特性,利用待溯源数据的关联数据推导出来源数据的关联数据;

20、由来源数据的资源标识和关联数据拼接出来源数据的标识。

21、第二方面,本专利技术提供一种电子设备,包括:存储器,用于存储程序;处理器,用于执行存储器存储的程序,当存储器存储的程序被执行时,处理器用于执行第一方面中所描述的任一方法。

22、第三方面,本专利技术提供一种存储介质,存储介质存储有计算机程序,当计算机程序在处理器上运行时,使得处理器执行第一方面中所描述的任一方法。

23、总体而言,通过本专利技术所构思的以上技术方案与现有技术相比,具有以下有益效果:

24、在传统的标注法中,为了进行数据溯源,通常需要在数据记录中添加各种标注数据,如数据来源表名、数据来源模式名、数据来源主键id等等。这些标注数据往往需要占用5-6个字段进行存储,这不仅浪费了宝贵的数据存储空间,还使数据管理变得复杂。

25、然而,本专利技术在传统标注法的基础上采用了一种更加智慧的方法。它创建了资源标识作为主键的资源标识信息表作为字典表,将数据记录的来源表资源信息精简压缩至一个名为标识的字段中。同时,将标识作为数据的主键,这意味着只需要一个字段就能完成传统标注所需的5-6个字段的信息存储。这一创新性方法巧妙地解决了数据溯源中标注信息存储空间庞大、反向查询繁琐以及聚类查询准确度下降的难题。

26、这项创新不仅提高了数据溯源的准确性,还明显降低了标注信息的存储需求,同时提高了溯源查询的效率。总之,这一智能且高效的解决方案使得数据溯源变得简单、高效、快速。

本文档来自技高网...

【技术保护点】

1.一种基于标识的数据溯源方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,先随机生成来源数据标识中的关联数据,且所述关联数据是唯一的,再通过来源数据标识中的关联数据推导出目的数据标识中的关联数据。

3.根据权利要求2所述的方法,其特征在于,若目的数据只具有一个来源数据,则来源数据标识中的关联数据等于目的数据标识中的关联数据。

4.根据权利要求2所述的方法,其特征在于,若目的数据具有两个及以上的来源数据,则采用哈希函数由来源数据标识中的关联数据生成目的数据标识中的关联数据。

5.根据权利要求4所述的方法,其特征在于,建立目的数据标识和对应来源数据标识的映射关系。

6.根据权利要求5所述的方法,其特征在于,将目的数据标识和对应来源数据标识的映射关系存储到数据库中。

7.根据权利要求2所述的方法,其特征在于,随机生成来源数据标识中的关联数据,具体为:采用GUID函数、哈希函数和自定义随机函数中至少一种函数生成唯一的关联数据。

8.根据权利要求1所述的方法,其特征在于,依据所述标识进行数据溯源,具体为:

9.一种电子设备,其特征在于,包括:

10.一种存储介质,所述存储介质存储有计算机程序,其特征在于,当所述计算机程序在处理器上运行时,使得所述处理器执行权利要求1-8中任一所述的方法。

...

【技术特征摘要】

1.一种基于标识的数据溯源方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,先随机生成来源数据标识中的关联数据,且所述关联数据是唯一的,再通过来源数据标识中的关联数据推导出目的数据标识中的关联数据。

3.根据权利要求2所述的方法,其特征在于,若目的数据只具有一个来源数据,则来源数据标识中的关联数据等于目的数据标识中的关联数据。

4.根据权利要求2所述的方法,其特征在于,若目的数据具有两个及以上的来源数据,则采用哈希函数由来源数据标识中的关联数据生成目的数据标识中的关联数据。

5.根据权利要求4所述的方法,其特征在于,建立目的数据标识和对...

【专利技术属性】
技术研发人员:李显锋张雄彪熊纯张永强
申请(专利权)人:武汉达梦数据技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1